SRE (Site Reliability Engineer) Nedir?

SRE, Site Reliability Engineer, içerisinde yazılım mühendisliği yetkinliklerini içeren ve bunları altyapı ve operasyon çözümlerinde uygulayan bir mühendislik disiplinidir. SRE konsepti ilk olarak Google tarafından ortaya çıkarılmıştır ve günümüzde ise günden güne popülerliğini arttırmaktadır.

SRE ekipleri, sistem ekiplerinin günümüzde manuel olarak gerçekleştirdikleri operasyon görevlerini yazılım mühendisliği yetkinlikleriyle otomatikleştirmeyi hedeflemişlerdir. Bu noktada operasyon yükünü azaltıp iş yükünü karşılamak için, daha fazla çalışan ihtiyacını ortadan kaldırmak için mühendislik odaklı çalışmalar yürütmektedirler. Çalışan iş yükünü azaltmasının yanı sıra daha fazla çalışan daha fazla maliyet demek olduğundan şirketler tarafından bu düzene geçişte artışlar görülmektedir.

SRE ekiplerini vakitlerinin bir bölümünü log analizi, performans takibi ve çeşitli sorunlara çözümler için ayırsa da kalan vakitlerini otomasyon için kod geliştirmek için kullanırlar. Uçtan uca otomasyon sistemi inşa edebilmeyi ve manuel işletilen tüm süreçleri en aza indirmeyi hedeflerler.

Bir sonraki yazımızda SRE ve DevOps arasındaki ayrıntılı farklara değiniyor olacağız.

--

--