AIOps nedir ?

Halil Uzumcu
Turk Telekom Bulut Teknolojileri

--

Şemadan yola çıkarsak geçmişe ve günümüze ait dataların oluşturduğu big datanın analiz edildiği, sistemlerin performans ölçümlerinin yapıldığı, her türlü anomalinin tespit edildiği bir yapıda; risklerin hesaplandığı, otomatik taskların yapılandırıldığı, performans iyileştirmelerinin sağlandığı, olumlu ve olumsuz her türlü bilgi yönetiminin yapıldığı bir süreç neticesinde tam otomasyon ile bilgi teknolojileri operasyonlarını yapabilmektir. Burada dikkat edilmesi gereken kısım biten bir süreç değil, devamlı kendini tekrarlayan bir süreçtir. Sisteminize eklediğiniz yazılım veya donanım neticesinde bütün süreç tekrar etmektedir.

AIOps (Artificial Intelligence for IT Operations) isminden de anlaşılacağı gibi bilgi teknolojileri operasyonları için yapay zekayı kullanmaya denir. Günümüz sistemlerinde oluşan büyük verileri makine öğrenimi yöntemleri ile yapay zeka kullanarak tam otomasyona geçirip, manuel eforların yerini otomasyon yazılımlarının alması hedeflenmektedir. AIOps’u anlamak için bazı kavramların yerine oturması lazım. Bilgi teknolojileri operasyonları, otomasyon, yapay zeka, makine öğrenimi. Yazının devamında bilgi teknolojileri operasyonları ile otomasyon konusunu ele alacağız

Bilgi teknolojileri operasyonları nelerdir ele alalım. Bir yazılımcımız var ve kendi bilgisayarında herhangi bir ihtiyaç için bir yazılım üretti, testleri tamam, yayınlamaya karar verdi. Yayınlamak için sanal ya da fiziksel bir sunucu kaynağı lazım, bu sunucunun ve yazılım korunması için güvenlik operasyonları lazım, dış dünya ile veya diğer yazılımlarla haberleşmesi için network operasyonları lazım, ola ki bir olumsuzluk durumunda geri dönüşün sağlanması için yedekleme operasyonları lazım. Kısaca yukarıda da anlatmaya çalıştığımız gibi yazılımın yayınlanması için gereken bütün operasyonlara bilgi teknolojileri operasyonları deniliyor.

Gelelim otomasyona, çok geniş ve çok uzun bir tarihi olan bir konu. Geniş pencereden bakacak olursak tekerleğin icadı, sanayi devrimi, kullandığımız mekanik aletler, yaşamımızı kolaylaştıran her eşya bir otomasyon sonucudur. Ama biz alanı daraltıp konumuz olan bilişim sektöründeki otomasyonun nedenlerine değineceğiz. Önlemez şekilde büyüyen ve hızlanan bir teknoloji var ve bunun neticesinde artan veri, artan loglar, artan alarmlar …… Sonuçta insanoğlunun yakın gelecekte bu teknolojiyi otomasyon ürünleri olmadan yönetmesi çok zor gözüküyor. Esas hedef tamamen yazılımların yönettiği insan etkisinin sıfır olduğu bir düzen. Ama henüz o aşamada değiliz. Güncel hedef ise insanoğlunun bu büyüyen yapıyı yönetebilmesi için otomasyonu kullanması.

Anlattıklarımız ile ilgili bir örnek verelim, Google 2008 yılında, 2015 için 100 milyon sunucu sayısına ulaşacağını ve bunun için 100 bin sistem yöneticisi istihdam etmesi gerektiğini hesapladı. Çözüm olarak, bu kadar insanı istihdam etmek yerine Borg altyapısını geliştirdi ve günümüzde Kubernetes olarak anılan bu altyapı ile tam otomasyona geçti. Bu sayede, Google şu anda 252 milyon sunucuyu, 19000 civarı sistem mühendisi ile yönetebiliyor. Bu hesaptan hareketle, yakın gelecekte yüz milyonlarca sistem yöneticisine ihtiyacımız olacak gibi görünüyor. Google’ın kendine özel olarak geliştirdiği tam otomasyon alt yapısını sistem yönetilen her ortamda kullanabilmek şimdilik mümkün değil, bundan dolayı da her şirket kendi otomasyonu için zaman harcıyor.

Konunun oturması için üç farklı tecrübe ve senaryo karışımı örnek verelim

* On katlı bir binanın networkünü yönettiğinizi düşünün. Bir omurga olsun ona bağlı 20 kenar switch olsun. Network cihazları genellikle Linux üzerine ihtiyaca göre özelleştirilmiş işletim sistemlerine sahiptir. Her switch e tek tek bağlanıp işlemlerinizi komutlar üzerinden yapmanız gerekir. Bu da belli bir ekiple belli bir zaman alacak işlemler toplamı olur. Bunun yerine üreticiler otomasyon için management yazılımlarını geliştirdiler. Bu yazılımlar neticesinde bütün cihazlarınızı bu yazılıma ekleyip, tek bir ekrandan erişim ile bütün cihazları kontrol edip, ihtiyaca göre tamamına ya da belli bir kısmına gerekli ayarlamaları yapabilirsiniz.

Burda on katlı bir binadan bahsettik, bunu daha büyük bir binanın ya da binaların ya da bir şehrin network ü gibi düşünürsek otomasyonun ne kadar önemli olduğu ortaya çıkıyor.

* Gelelim diğer bir örneğe; şehirlerimizde sayısız alt geçit var, bazıları özellikle günümüz yağmurlarında sorun oluşturabiliyor. Sonuçta her geçit için ekip ve araç bulundurma imkanımız yok. Bunun önüne geçebilmek için bir hava tahmin sistemi geliştirip, ilgili ekipleri önceden uyarıp gerekli geçitlere müdahale için yönlendirmeyi amaçlayan bir otomasyon projesi yaptınız. Proje düzgün çalışırsa mükemmel sonuçları olur ama ya düzgün çalışmazsa zaten yağmurlarla kaos da olan bir şehrin saha ekiplerini de yanlış güzergahlara yönlendirerek oluşacak sıkıntının büyüklüğünü bir düşünün.

* Son örneğimizde log analiz yazılımları ile ilgili. Yine network örneğinden düşünelim, birden fazla üreticinin cihazına sahibiz ve bu cihazlar birbiri ile haberleşip network yönetimde sorun çıkarmadan devam edebiliyorlar. Ama loglama formatları farklı. Otomasyonun altyapısını oluşturabilmek için log analiz yazılımı aldık. Bu yazılıma cihazlarımızın ürettiği logları ayrı ayrı transfer edip, çeşitli analiz ve raporlar alabiliyoruz ama tamamı hakkında raporlar istediğimizde raporlar düzgün gelmiyor, çünkü farklı üreticilerin cihazlarının veri toplama yöntemleri aynı değil.

Özetle AIOps’u yapılandırabilmek için sahip olduğunuz donanım ve yazılımların birbirleriyle ve AIOps yazılımları ile tam uyumlu olması gerekmektedir. Hazırladığınız senaryo da ihtiyacı tam karşılamalıdır. Yoksa örneklerde de anlatmaya çalıştığım gibi projeniz neticesinde sisteminiz başladığınızdan da daha olumsuz bir duruma düşebilir. Ama doğru konumlandırılmış bir AIOps ile de sisteminizin yönetimi ile ilgili muazzam faydalar sağlayabilirsiniz.

Kaynaklar

https://acikkaynakfikirler.com/aiops-nedir/

https://www.bmc.com/blogs/gartner-aiops-market-guide/

--

--