Disaster Recovery — Felaket Kurtarma Teknik ve Taktikleri

Adil Deveci
Doğuş Teknoloji
Published in
5 min readOct 19, 2022
Disaster Recovery, felatek kurtarma, odm

Olağanüstü durumlarda veri kaybı ve iş kesintisinin önüne geçmek için çeşitli Disaster Recovery (Felaket Kurtarma) süreçleri bulunmaktadır.

Bu işlem için oluşturulan merkezlere Olağanüstü Durum Merkezi (ODM) denilir. Asıl amaç veri yedeklemek değil, bir felaket durumunda coğrafi olarak başka bir konumda sistemlerimizi çalıştırabilecek şekilde önlem almaktır.

Disaster Recovery bir kuruluşun doğal afet, arıza, siber saldırı vb. olağan üstü durumlarda IT altyapısına yeniden erişim ve işlevsellik kazanma yöntemidir. İş sürekliliği için her zaman verilerin korunması ve sistemlerinizin kesintisiz olarak hizmet vermesini sağlamak gerekmektedir. Altyapılarda yaşanan problemler kurumları geri dönüşü olmayan felaketlere sürükleyebilir veya onarılması zor sorunlara yol açabilir.

Bir süredir kurumumuzda ODM çalışmaları yapılmakta ve bir yazılım ekibi olarak bizde sürece dahil olmuş durumdayız. Yaptığımız çalışmalar hakkında kısa bilgi vermek istiyorum. Kurumumuzun mevcutta alt yapısı İstanbul konumunda fakat olası bir felaket senaryosunda aynı IT süreçlerimizi kesinti olmadan veya minumum kesinti ile farklı bir lokasyonda devam ettirebilmek istiyoruz. Bunun için Ankara konumunda bulunan veri merkezini kullanmaktayız. Sunucularımızın ve uygulamalarımızın birebir aynı yedekleri Ankara’ya taşınmış durumda. Bulut platformunda olan uygulamalar için de benzer süreç işletilmekte. Yaptığımız çalışmalar ile alakalı daha fazla teknik detaya girmeyeceğim.

Örnek Vaka (Banka krizi)

Örnek olarak bir bankada yaşan sorunu gösterebiliriz, yasal olarak sorun yaşamamak için XBank diyelim. Temmuz 2021 tarihinde XBank ana bankacılık sistemi veri tabanında ve disk yönetim sisteminde bir sorun oluşması üzerine bankanın bütün kanalları bu sorundan etkilendi ve kesintiler yaşandı. Bu sorun birçok müşterinin uzun süre mağdur olmasına sebebiyet verdi. XBank’ ın ana bankacılık sisteminde yaşadığı sorunun bu kadar uzamasının en büyük nedeni yedek sistemin devreye girememesi idi. Daha önce XBank’ın Ege bölgesindeki yedek veri merkezinin sel baskını dolayısıyla güvenlik gereği Kocaeli’ye taşınması kararı alınmış fakat olayın gerçekleştiği Temmuz tarihinde taşınma tamamlanmadığı için yedek sistem devreye girememiş. Felaket durumlarında ODM ya da yedek sistemlerin devreye girip girmediğine ilişkin tatbikatlar yapılmalı.

Başarılı Bir ODM için Gerekli Beş Kriter

Başarılı ve sorunsuz bir ODM sisteminden bahsetmek için şu kriterlerin sağlanmış olması önemlidir.

Kurtarma Ekibi: Bu atanmış uzman grubu, olağanüstü durum kurtarma planının oluşturulmasından, uygulanmasından ve yönetilmesinden sorumludur. Bu plan her ekip üyesinin rolü ve sorumluluklarını tanımlamalıdır. Bir felaket durumunda kurtarma ekibi birbirleriyle, çalışanlarla, satıcılarla ve müşterilerle nasıl iletişim kuracağını bilmelidir.

Risk Değerlendirmesi: Kuruluşunuzu riske atan potansiyel tehlikeleri değerlendirin. İşe devam etmek için hangi önlemlere ve kaynaklara ihtiyaç duyulacağını strateji olarak belirleyin.

Öncelik Tanımlama: İyi bir ODM planı iş sürekliliği için hangi sistemlerin, uygulamaların, verilerin ve diğer kaynakların öncelikli ve kritik olduğunu belirlemelidir. Ayrıca verileri kurtarmak için gerekli adımların nasıl atılacağının tanımlandığı bir dokümantasyon oluşturmalı ve bunu güncel tutmalıdır.

Yedekleme: Neyin yedeklenmesi gerektiğini, kimin yedekleme yapması gerektiğini ve yedeklemelerin nasıl uygulanacağını stratejik olarak belirlemelidir. Olağanüstü bir durum sonrası oluşabilecek aksama süresi belirlenmelidir. Bu bilgiler felaket durumunda hangi prosedürlerin işletilmesi konusunda belirleyici rol oynar.

Test ve Optimizasyon: Kurtarma ekibi, sürekli gelişen tehditleri ve iş ihtiyaçlarını ele almak için stratejisini sürekli olarak test etmeli ve güncellemelidir. Bir şirket felaket durumlarında en kötü senaryolarla yüzleşmeye karşı hazırlık yaparak bu tür zorlukların üstesinden kolaylıkla gelebilir. Örneğin bir siber saldırıya karşı önlem alırken, kuruluşların güvenlik ve veri koruma stratejilerini sürekli olarak test ve optimize etmeleri ayrıca potansiyel güvenlik ihlallerini tespit etmek için koruyucu önlemler almaları önemlidir.

Kurtarma Ekibi Nasıl Oluşturulur?

Yeni bir ODM planı oluşturuyorsanız ya da mevcut bir ODM sürecini iyileştiriyorsanız ilk adım doğru bir uzman ekip oluşturmaktır. Bir felaket durumunda süreç ilk olarak kriz yönetiminden yardım alma ile başlar.

Kriz Yönetimi: Bu liderlik rolü, kurtarma planlarını başlatır, kurtarma süreci boyunca çalışmaları koordine eder ve ortaya çıkan sorunları veya gecikmeleri çözer.

İş Sürekliliği: Bunu denetleyen uzman, işin etki analizine göre kurtarma planının şirketin iş ihtiyaçları ile uyumlu olmasını sağlar.

Etki Değerlendirmesi ve Kurtarma: Bu kurtarma alanından sorumlu ekip, sunucular, depolama, veritabanları ve ağlar dahil olmak üzere IT altyapısında teknik uzmanlığa sahiptir.

IT Uygulamaları: Bu rol, uygulamaların hareketlerini gözlemler. Uygulama entegrasyonlarını, uygulama ayarlarını ve yapılandırmasını ve veri tutarlılığını gibi görevleri vardır.

Kurtarma Yöntemleri

Felaket durumlarında uygulanabilecek birkaç farklı yöntem bulunuyor. Kuruluşlar kendilerine uygun bir yöntem belirlemesi gerekmektedir.

Back-up (Yedekleme): Bu, en basit felaket kurtarma türüdür ve verilerin şirket dışında veya harici bir sürücüde depolanmasını gerektirir. Fakat bu durumda IT altyapısı yedeklenemeyeceği için sadece verilerin güvenliği sağlanır ve bu da minimum düzeyde iş sürekliliğine katkı sağlar.

Cold Site (Soğuk Bölge): Bu yöntem, doğal bir afet veya yangından sonra çalışanların çalışabilmesi için nadiren kullanılan ikinci bir tesiste temel bir altyapı sağlar. İş operasyonları devam edebileceğinden iş sürekliliğine yardımcı olabilir, ancak önemli verileri korumanın veya kurtarmanın bir yolunu sağlamaz. Bu yüzden Cold Site diğer ODM yöntemleriyle birleştirilmelidir.

Hot Site (Sıcak bölge): Verilerin her daim güncel kopyalarının tutulmasıdır. Kurulumu zaman alan ve Cold Site’den daha maliyetli olan bir yöntemdir ancak hizmet dışı kalma süresini önemli ölçüde azaltır.

Disaster Recovery as a Service (DRaaS): DRaaS sağlayıcısı, bir kuruluşun IT işlemlerini kendi bulut altyapısına taşıyarak, söz konusu kuruluşun sunucuları aktif olmasa bile müşterilerin sorunsuz bir şekilde işlemlere devam etmesine olanak tanır. Yerel bir DRaaS sağlayıcısı seçmenin artıları ve eksileri vardır: Örneğin şirket lokasyonuna yakın olan DRaaS sunucularının olması felaket anlarında yedeklenen verilere erişimi hızlandıracak ancak güçlü bir doğal afet halinde DRaaS merkezi de bu durumdan etkilenecektir.

Back Up as a Service: Verileri uzak bir konumda yedeklemeye benzer. Bir hizmet sağlayıcı ilgili kuruluşun verilerini yedekler, ancak IT altyapısını yedeklemez.

Datacenter Disaster Recovery: Bir veri merkezinin fiziksel unsurları bazı felaket durumlarında ODM türlerinden daha hızlı katkıda bulunabilir. Örneğin, yangın söndürme araçları, yangın sırasında bilgisayarımızı kurtarabilir. Yedek bir güç kaynağı, elektrik kesintilerinde güç kaybını önleyerek işletmelerin operasyonlarına devam etmesine katkı sağlar. Fakat bu fiziksel felaket kurtarma araçlarının hiçbiri bir siber saldırı durumunda yardımcı olmayacaktır.

Virtualization (Sanallaştırma): Kuruluşlar, fiziksel felaketlerden etkilenmeyen tesis dışı sanal makinelerde belirli işlemleri ve verileri ve hatta bir kuruluşun tüm IT ortamının çalışan bir kopyasını yedekleyebilir. ODM planının bir parçası olarak sanallaştırmayı kullanmak, işletmelerin bazı ODM süreçlerini otomatikleştirmesine ve her şeyi daha hızlı çevrimiçi duruma getirmesine olanak tanır.

Point-in-time copies (Anlık Kopya): Belirli bir aralıkta tüm veritabanının bir kopyasını oluşturur. Veriler bu yedeklemeden geri yüklenebilir.

Instant recovery: Anında Sanal Makine Kurtarma, sanal makineyi doğrudan yedeklenmiş dosyalar üzerinden çalıştırarak sanallaştırma platformunuza geri yükler.

Bu yazımızda olağanüstü durumlarda alabileceğimiz önlemler hakkında incelemeler yaptık. Bir uygulamanın önemi ne kadar yüksek ise Disaster Recovery senaryoları da o kadar önem kazanıyor. Duruma göre maliyetleri ve riskleri değerlendirerek kurum ve kuruluşlar için en uygun olan yöntemi seçmek gerekir. Olağanüstü bir durumla karşılaşmamanız dileği ile hoşça kalın.

--

--