BT İzleme nedir? Nasıl Yapılır?

Soner Gulbahar
Fiba Tech Lab
Published in
5 min readMay 20, 2022

BT izleme; BT ortamlarınızda BT ekipmanlarınızın veya uygulamalarınızın kullanılabilir olduğundan ve işinizi sürdürmek için beklenen ve gereken düzeyde performans gösterdiğini kontrol etmek için bir takım metrikleri toplama sürecidir.

İzleme sistemlerini 3 temel kategoriye ayırabiliriz.

· Altyapı İzleme

· Ağ İzleme

· Uygulama Performans İzleme

Dilerseniz bu üç kategoriye kabaca değinelim.

Altyapı İzleme;

BT altyapısından, sistemlerinden ve süreçlerinden veri toplama, analiz etme ve bu verilere dayanarak iş sonuçlarını iyileştirmek ve tüm kuruluşta değer sağlamak için kullanma sürecidir.

Basitçe söylemek gerekirse, Kullanılabilirlik, performans ve kaynak verimliliğinin eksiksiz bir resmini sağlamak için gereken tüm verileri toplayarak uygulamalarınızın ve hizmetlerinizin kullanıcılarınız tarafından kullanılabilir durumda kalmasını sağlar.

Altyapı izleme, kuruluşların sorunlara proaktif bir şekilde yanıt vermesini sağlayarak zaman ve para kaybını önler. Bu, altyapı izlemeyi kritik görevin özü haline getirerek şu temel yetenekleri sağlar:

· İş gereksinimlerini ve kullanıcı deneyimini optimize etme yeteneği

· Çeşitli kaynaklardan veri alma ve planlı ve plansız trafik artışlarını yönetme esnekliği ve ölçeklenebilirliği

· Arıza süresini en aza indirgemek ve operasyonel verimliliği artırmak için kesintileri, kaynak kullanımını ve performans düşüşlerini algılama ve uyarma yeteneği

· Altyapıda veya uygulamada bir sorunun nereden kaynaklandığını tam olarak belirlemek için kök nedenleri belirleme yeteneği

· Belirli hatalı altyapı bileşenlerinin detayına inme ve düzeltmeyi tetikleme yeteneği

Doğru bir Altyapı izleme yaklaşımı için neler yapılmalıdır?

Önemli olan her şeyde olduğu gibi, bir sistem ancak uygulanması ve yönetimi kadar etkilidir. İşletmenizin ihtiyaçlarını karşılayan bir altyapı izleme araçları kurmak için aşağıdaki yaklaşımları kullanabilirsiniz;

Uyarıları önceliklendirin: Hangi bildirimlerin aciliyet gerektirdiğine karar verin ve son kullanıcılar için kesinti süresine veya olumsuz bir deneyime neden olabilecek bir sorunu kaçırmamak için her biri için ayrıntılı uyarılar ayarlayın.

Bir deneme çalıştırması planlayın: En iyi düşünülmüş sistem bile ince ayar gerektirebilir. Uyarı sisteminizin ne kadar iyi çalıştığını öğrenmek için gerçek bir acil durumu beklemeyin.

Yedekliliği benimseyin: Şirket içi ve bulut tabanlı çözümlerin bir kombinasyonunu kullanarak her olasılığı hesaba katın. Ayrıca, birden fazla veri merkeziniz varsa, ekstra güvenlik için her bir konumu izleyin.

Metriklerinizi kontrol edin: Performans metriklerinizi düzenli olarak gözden geçirin. İlk eşiklerinizin ve ayarlarınızın zaman içinde tutarlı veya alakalı kalacağına güvenmeyin. Optimum performansı sağlamak için periyodik olarak incelemeler yapın.

Destek hizmetlerini kullanın: Satıcıların size yardımcı olacak destek personeli, danışmanları ve yardım merkezleri vardır. Bir soru veya sorunla karşılaştığınızda, bağımsız olarak sorun gidermeye çalışarak kaynakları boşa harcamak yerine, bunları sizin sağlayacak ekiplerin çalışasını sağlayın. Bazen her geçen zaman aleyhinize işleyebilir.

Ağ İzleme

Günümüz dünyasında, Network İzleme terimi BT endüstrisinde yaygın olarak kullanılmaktadır. Network İzleme; router , switch, firewall, sunucular ve VM’ler gibi tüm ağ bileşenlerinin hata ve performans açısından izlendiği ve kullanılabilirliklerini korumak ve optimize etmek için sürekli olarak değerlendirildiği kritik bir BT sürecidir. Ağ izlemenin önemli bir yönü, proaktif olması gerektiğidir. Performans sorunlarını ve darboğazları proaktif olarak

bulmak, sorunları ilk aşamada belirlemeye yardımcı olur. Verimli proaktif izleme, ağ kesintilerini veya arızalarını önleyebilir.

Arızalı ağ cihazları ağ performansını etkiler. Bu, erken tespit yoluyla ortadan kaldırılabilir ve bu nedenle ağ cihazı izleme son derece önemlidir. Etkin ağ izlemede ilk adım, izlenecek cihazları ve ilgili performans metriklerini belirlemektir. İkinci adım, izleme aralığının belirlenmesidir.

Masaüstü bilgisayarlar ve yazıcılar gibi cihazlar kritik değildir ve sık izleme gerektirmezken, sunucular, routerler ve switchler iş açısından kritik görevleri yerine getirir ve aynı zamanda seçici olarak izlenebilen belirli parametrelere sahiptir.

Uygulama Performans İzleme

Basitçe söylemek gerekirse, uygulama performans yönetimi, yazılım uygulamalarının performansını, kullanılabilirliğini ve kullanıcı deneyimini yönetme sanatıdır.

Uygulama Performans İzleme (APM), işlemlerin hem son kullanıcılar hem de bir yazılım uygulamasını destekleyen sistemler ve ağ altyapısı tarafından gerçekleştirilme hızını izleyerek olası darboğazlar ve hizmet kesintileri hakkında uçtan uca bir genel bakış sağlar. Bir uygulamanın hızını, güvenilirliğini ve diğer performans ölçümlerini en uygun hizmet düzeyini korumak için görüntülemek ve teşhis etmek için yapılan izlemelerin tamamıdır.

Yük testi, sentetik izleme ve gerçek kullanıcı izleme ve kök neden analizi, APM’ye çok yönlü bir yaklaşımda bulunabilecek başlıca araçlardan birkaçıdır.

APM nihayetinde bir perspektiftir — son kullanıcı deneyimini net bir şekilde anlamak ve sürekli olarak iyileştirmek için yazılım performansının her yönüne dayanan analitik bir bakıştır.

BT izleme nasıl yapılır?

Günümüz dünyasında maalesef %100 uptime olan bir sistem bulunmamaktadır. Ancak uygulamalarımızı veya servislerimizin tüm bileşenlerini (Altyapı, Ağ, APM) izleyerek hataları ve performans sorunlarınızı minimize edebilirsiniz. Bu sayede %100 olmasada %100 e yakın bir uptime yakalayabilirsiniz.

Yukarıda saydığımız üç kategoriden yanlızca biri, ikisi veya hepsini aynı anda kullanarak izleme yapabilirsiniz. Ancak unutmamalısınız ki doğru bir izleme yaklaşımı bu üç kategorinin aynı anda kullanılarak izleme yapılmasıyla doğru orantılıdır.

Hadi bir örnekle açıklayalım.

Yukarıdaki görselde bir Anabankacılık servisimiz ve bu servisimizin bileşenleri olan 2 sunucu 1 firewall birde müşterilerimizin işlem yapabildiği abc-bankservices.com adında bir web uygulamamız mevcut.

Anabancalık servisindeki altyapı bileşenlerinden sunuculardaki Cpu, Memory, Disk ve Ping değerlerini izlediğimizi varsayalım.

Müşterilirinizden şikayet geldi; abc-bankservices.com web sayfasına erişemiyoruz. Kontrol sağladını ve gördünüz ki sunucularınızdaki tüm değerler normal ama bankacılık servisiniz çalışmıyor. Tamda bu noktada doğru izleme yapmamanın önemini anlıyoruz. Eğer biz sunucuların yanında Ağ bileşenlerini ve web uygulamamızın performansınıda izleseydik, doğru eşik değerlerini verseydik daha müşterilerimizden şikayet gelmeden sorunu anlayacak ona göre çözüm üretebilecektik. Yanlış veya eksik izleme yaparsanız hem proaktiflikten uzaklaşır hem de zaman kaybına uğrarsınız.

Neyi izleyeceğimize nasıl karar vermeliyiz?

Uygulamalarımız veya servislerimizde neyi izleyeceğimize karar verirken o uygulamanın veya servisin yapısına hakim olmamız gerekir. Bu nedenle bir çok firmada izleme ekipleriyle diğer ekipler koordineli olarak çalışır. Çünkü izleme yapısını kuran ekip tamamen uygulama yapısına hakim olmayabilir. Doğru yöntemler ve iyi bir koordinasyon ile doğru bir izleme yapısı kurulabilir,

Peki uygulama sahipleri neyi izleyeceğine nasıl karar verecek?

Bir uygulamanın ayakta ve performanslı çalışmasını sağlayan Key Performance Indicator(KPI) belirlyip bu KPI’lara ait Healt Indicatorleri(HI) izlemelidir.

Örnek vermek gerekirse;

Yukarıdaki tabloda Sistem performansı KPI iken bu KPIı ölçmeye yarayan Cpu Utilization bir Health Indicatordur. Burdan anlaşılacağı üzere ilk yapmamız gereken şey doğru KPI ları belirlemek ve bu KPI larımızı sağlayacak metrikleri izlemektir.

Bunların dışında öngeremediğimiz bazı izlememiz gereken metrikler olabilir. Öngöremediğimiz metriklerimizi ise yaşarak görmek zorunda kalabiliriz. Burda önemli olan nokta öngöremediğimiz metrikleri minimize etmek, yapabiliyorsak sıfıra indirgemektir.

Hangi İzleme Aracını kullanmalıyız?

Günümüzde bir çok ücretli veya Open-Source İzleme aracı bulunmaktadır. Bu araçlar Ajanlı veya Ajansız çalışabilmektedir.
Burda önemli olan seçim noktası ihtiyaçlarınızı hangi aracın karşılayıp karşılamamasıdır. İzleme önemli bir süreçtir ve doğru izleme araçları seçilmedir. Seçim yapılırken de acele edilmemeli, araçlar arası bir kıyaslama yapılmalı, sizin istediklerinizin ne kadarını yapabiliyor deneyerek karar verilmelidir. Bir çok aracın teknik dökümanlarında bir çok şeyi yapabildiği yazsa da o aracı birebir deneyimleyerek yapabilirliğini kontrol etmek çok önemlidir. Çünkü kullanılan araç ve sizin sahip olduğunuz temel donanımlar birbirini desteklemiyor olabilir. Tüm kıyaslamarın yanında benzer özelliklerdeki araçlar arasında fayda/maliyet oranına bakılarak doğru araç seçilebilir. Ayrıca ürün seçerken en önemli noktalardan biride seçtiğiniz ürünün destek sisteminin yeterli olmasıdır. Sorun anında müdahale edebilecek, arka planda açtığınız olay kayıtlarına çözüm üretebilecek, sizi her zaman güvende hissettirecek bir ekibin olması gerekir. Tüm bunları gözönünde bulundurarark doğru izleme aracı seçimini yapabilirsiniz.

--

--