Disaster Recovery Center

Krzysztof Kempiński
Oct 5 · 12 min read
Image for post
Image for post

W ramach podcastu “Porozmawiajmy o IT” miałem okazję porozmawiać z Robertem Mikołajskim z firmy Atman o zapasowym centrum danych, czyli Disaster Recovery Center.

Posłuchaj naszej rozmowy w wersji audio 🎧 👇

Cześć! Mój dzisiejszy gość to Product Manager w firmie Atman. Osoba z ponad 15-letnim doświadczeniem w obszarach rozwiązań SaaS i IaaS, Dedicated Servers, Cloud computing, oraz customer supportu po programowanie, sprzedaż i consulting. Prywatnie fan kryminałów i rolek. Moim i Waszym gościem jest dzisiaj Robert Mikołajski. Cześć Robert! Miło mi gościć Cię w podcaście!

Cześć, cześć! Witam wszystkich!

Z Robertem porozmawiamy sobie o Disaster Recovery Center, które to w polskiej nomenklaturze jest bardziej znane jako Zapasowe Centrum Danych. Robert ma wiele lat doświadczenia w tym obszarze. Tę wiedzę i doświadczenie postaram się tutaj dzisiaj wyciągnąć.

Zawsze pytam na początku moich gości, o to, czy słuchają podcastów? Jeśli tak, to jakich najczęściej? No i z tym samym pytaniem do Ciebie Robert też się udaję.

Trochę Cię rozczaruję, bo rzeczywiście to medium do mnie nie trafiło do końca. Śmieje się trochę, że jestem jeszcze zakorzeniony w poprzednim pokoleniu, które tę wiedzę bardziej woli przyswajać albo z jakiegoś rodzaju warsztatów, szkoleń przeprowadzanych na żywo, tudzież jeżeli w formie elektronicznej, webinarów, albo z książek czy jakichś dokumentacji. Rzeczywiście, jak zaangażowany jest tylko mój słuch, a nie wzrok, to mam tendencję do rozpraszania się. Audiobooki w ten sposób bardzo chętnie, beletrystykę, ale już merytorycznie nie daję rady.

Jasne, rozumiem. Może kiedyś się przekonasz, bo to ciekawe medium. Cieszę się przynajmniej z tego, że poprzez podcasty dzielisz się swoją wiedzą. To już jest dobry krok. Na początku chciałem Cię zapytać z jak dużym problemem może się wiązać utrata danych albo utrata dostępu do infrastruktury wśród firm? Czym to im grozi, jakie straty generuje? Z jakimi przestojami takie działalności gospodarcze muszą się liczyć? To jest problem, który tylko tyczy się małych, nierozwiniętych technologicznie form, czy może jest to znacznie szersze zagadnienie?

Jest to rzeczywiście dość szerokie zagadnienie. Im większy biznes tym w jakimś sensie sobie zaczyna z tym radzić, jest bardziej świadomy tego wyzwania utraty danych i w jakiś sposób sobie z tym radzi. Początkujący biznes może na to zwracać mniejszą uwagę. Jest raczej skoncentrowana na tym, żeby po pierwsze przetrwać, a po drugie się rozwinąć. Rzeczywiście tutaj bywa różnie. Jeśli chodzi o skutki utraty danych, czy wprost przestoju, bo to nie musi być utrata danych, lecz tylko przestój biznesu, to wpływ takiego zdarzenia na biznes w przypadku młodego biznesu, gdzie nie mamy wielu klientów, gdzie się rozwijamy i zaczynamy, będzie adekwatnie mniejszy niż w przypadku gdy biznes mamy rozkręcony, świadczymy jakieś usługi i rzesza klientów jest dotknięta takim problemem.

Tutaj pojawiało się wiele badań na ten temat. Od dłuższego czasu, bo w latach 90-tych, Gartner pokazał, że dwie z pięciu firm, gdzie przyjęła się duża awaria, nie jest w stanie się po niej podnieść. Tak naprawdę cały biznes pada. Ta skala wpływu potrafi być potężna. Z tych, co ocaleją, według tego samego badania, jedna trzecia z nich upada w ciągu jednego-dwóch lat, w przypadku takiej potężnej awarii. Niedługo, na początku XXI wieku, inne badanie Eagle Rock Alliance, pokazało, że techniczną niedostępność usług dla klientów, przez ponad trzy dni oznacza koniec dla nich. 40% biznesu się w ten sposób skończy w perspektywie mniej więcej trzech lat. Rzeczywiście dla dojrzałego biznesu, z dużą ilością klientów to jest must have, coś obowiązkowe, przed czym trzeba się chronić. W związku z tym gdzieś rozwijając biznes, należy z tyłu głowy o tym myśleć i się pod to przygotowywać.

Powiedziałeś tutaj całkiem dużo o konsekwencjach niezadbania o ten obszar. Natomiast jak gdyby idąc krok wstecz, jakie są najczęstsze przyczyny uniemożliwienia dostępu do danych? W którym momencie pojawia się ten problem, który może zaowocować brakiem dostępu do danych, czy całej infrastruktury?

Rzeczywiście tych przyczyn może być kilka. W ostatnich latach było głośno o różnego rodzaju atakach hakerskich, włamaniach, przejęciach komputerów, przejęciach systemu. Z takich dużych można wymienić NotPetya, który rzeczywiście spowodował, że naprawdę olbrzymie biznesy międzynarodowe, czy nawet instytucje publiczne, rządowe, musiały wstrzymać działania i miały długie przestoje.

W ostatnich latach było głośno o różnego rodzaju atakach hakerskich, włamaniach, przejęciach komputerów, przejęciach systemu. Z takich dużych można wymienić NotPetya, który rzeczywiście spowodował, że naprawdę olbrzymie biznesy międzynarodowe, czy nawet instytucje publiczne, rządowe, musiały wstrzymać działania i miały długie przestoje.

Wiele biznesów ucierpiało poważnie w wyniku tego ataku. Jednym z takich zagrożeń są zewnętrzne próby ataku i wpłynięcia na naszą organizację. Celowe lub nie, bo to różnie bywa. W tamtym ataku też bardzo dużo firm ucierpiało, które nie były na celowniku atakujących. Drugim źródłem zagrożeń są po prostu błędy. Błędy ludzkie, błędy w projektowaniu, czyli nawet takie wewnętrzne problemy infrastrukturalne, niekoniecznie wewnętrzne, bo to mogą być nawet przysłowiowo wspominana wielokrotnie koparka przecinająca światłowód, naprawiająca kanalizację. Takie błędy też się zdarzają. Trzeci z takich istotnych czynników to są awarie wynikające z wadliwości samego sprzętu, z tego, że pewne rzeczy się po prostu zużywają. Z takimi głównymi problemami trzeba się zmierzyć. Myśląc o zabezpieczeniach danych te różne scenariusze, trzeba trochę indywidualnie do tego podejść. Każda firma będzie miała troszeczkę inaczej ten biznes zbudowany, gdzie indziej będą postawione akcenty. W związku z tym będą inne te scenariusze i automatycznie adekwatne będą do tego różne zabezpieczenia.

Nakreśliłeś tu w jakiś sposób problem, z jakim musimy się mierzyć. Spróbujmy teraz przejść do potencjalnych rozwiązań. Jednym z takich dość skutecznych zabezpieczeń na tego typu sytuacje, jest właśnie Zapasowe Centrum Danych, czyli Disaster Recovery Center, o którym za chwilę sobie porozmawiamy. Jak mógłbyś zdefiniować, czym jest takie Centrum, zarówno od strony biznesowej, jak i technologicznej?

Zapasowe Centrum Danych, polska nazwa nie jest wiernym tłumaczeniem tej angielskiej, jest pojęciem dość szerokim. Można pod nie podciągnąć bardzo różne rozwiązania technologiczne. Patrząc z punktu widzenia technologicznego to w skrajnym przypadku może być osobna lokalizacyjnie, wydzielona część naszej infrastruktury zlokalizowana właśnie w innym miejscu. Może być zbudowana 1:1, identycznie z tą, którą mamy, używamy produkcyjnie. Mogą to być nasze serwery w kolokacji, w jakimś centrum danych Atman, takim jak prowadzi Atman. Może też być to zupełnie inna infrastruktura z punktu widzenia innego, zbudowania jej. Można ją zbudować na chmurze, czy na serwerach dzierżawionych na przykład. Scenariuszy można wymyślić bardzo dużo.

Tak samo, jak kwestia tego, czy będzie to zestawione w jakimś klastrze active-active, czy jeden ośrodek będzie miał rolę aktywną, drugi będzie pasywny, czy w ogóle ten drugi, to centrum zapasowe, będzie wyłącznie wykorzystywane w celach backup tak naprawdę, a niekoniecznie jako pełnoprawne funkcjonujące środowisko. Z punktu widzenia biznesowego, kluczowe jest to, że to Zapasowe Centrum Danych ma zapewnić przede wszystkim Business Continuity, czyli ciągłość działania biznesu. To jest clou powołania takiego Zapasowego Centrum Danych. Ma pomóc w odtworzeniu infrastruktury produkcyjnej z powrotem do pierwotnego działania, po awarii lub ataku, zdarzeniu, które nam się tak naprawdę przytrafiło. Z punktu widzenia biznesowego, głównie chodzi o miejsce, które nam zapewni ciągłość działania. Niedoprowadzenie do tego, że będzie jakaś przerwa, przestój, brak możliwości obsługi klienta, czy świadczenia swoich usług na rynku.

Z punktu widzenia biznesowego, głównie chodzi o miejsce, które nam zapewni ciągłość działania. Niedoprowadzenie do tego, że będzie jakaś przerwa, przestój, brak możliwości obsługi klienta, czy świadczenia swoich usług na rynku.

Rozumiem. Chciałbym pociągnąć ten temat, zapytać się trochę jakie zalety są z posiadania takiego Zapasowego Centrum Danych? Kiedy firma może określić, że jest już na takim etapie rozwoju, czy prowadzi taki biznes, który wymaga posiadania, czy może mieć korzystny wpływ na prowadzenie biznesu, posiadanie Zapasowego Centrum Danych? Jest jakaś reguła, może zestaw czynników, które warto wziąć pod uwagę, żeby zdecydować, czy już jesteśmy w takim etapie rozwoju, że powinniśmy się właśnie posiłkować tego typu rozwiązaniami?

Będzie to rzeczywiście troszeczkę indywidualna kwestia. Bardzo dużo powie nam analiza, jak bardzo nasz biznes polega na IT. W obecnych czasach coraz częściej i w wielu branżach jest to powiązanie bardzo ścisłe powiązanie do IT i uzależnienie od tego IT w prowadzeniu biznesu jest kluczowe. Dalej, tak jak mówiłem, analiza tego, co się może przytrafić i jaki to będzie miało wpływ na nasz biznes. Jeśli używamy serwera, plików, mamy małą firmę graficzną i trzymamy wszystkie pliki graficzne na serwerze plików i wysyłamy je do klientów. Mamy różne projekty i kilka osób na nich pracuje, to wyłączenie takiego serwera, jakaś jego awaria, powoduje, że może praca nie stanie, ale jeśli nie mamy jakichś backupów, nie mamy „mikro” Zapasowego Centrum Danych, rozwiązania, które nam pomaga przywrócić sobie utracone dane, to jest pewne ryzyko, że utraciliśmy to, na czym zarabiamy, albo to, czego oczekują od nas klienci. Tutaj jest sprawa dyskusyjna, bo mogliśmy robić backupy na jakimś innym, zewnętrznym dysku i już wystarczy w zasadzie, biznes nie jest zagrożony. Natomiast jeśli jesteśmy firmą wear wostingową , czyli nasi klienci, na naszych serwerach korzystają ze stron internetowych, to tutaj wyłączenie takiego serwera, przyczyn mogą być setki, powoduje, że realnie oni nie są w stanie świadczyć swojego biznesu i my nie świadczymy dla nich usług. Nie zapłacą nam faktur, każda przerwa tutaj i każdy, kto prowadzi Web Hosting, to powie, że krótka, nawet kilkuminutowa przerwa to będzie automatycznie wiązała się z licznymi kontaktami od naszych klientów, dlatego, że ta strona nie działa. Moi klienci nie mogą jej zobaczyć, więc automatycznie cierpi mój biznes, mój wizerunek. Wiadomo, że tego typu firmy już bardzo dbają o to, żeby na dość szybkim etapie wdrażać rozwiązania high availability, czyli właśnie wysoką dostępność, po to, żeby żadna awaria pojedynczego komponentu, single point of failure, nie nastąpił. Czyli żeby dowolna awaria dowolnej infrastruktury, czy jakiś błąd ludzki, nie był w stanie przerwać działania usługi. Bardzo dużo zależy od samodzielnej analizy, jaki rodzaj biznesu prowadzimy i jak bardzo ten IT wpływa na nasz core biznesu.

W przypadku disaster recovery mówimy o czymś takim jak zapewnienie ciągłości usług. Nie są to powiedzmy, jakieś pojęcia tożsame, ale w jakiś sposób na siebie zachodzą. Chciałem Cię zapytać, w jaki sposób następuje przepięcie na korzystanie z takiego Zapasowego Centrum Danych? Czy jest to proces w jakiś sposób zautomatyzowany, czy klienci ręcznie decydują, że w tym momencie chcą korzystać z Zapasowego Centrum Danych, bo jakieś wydarzenie miało miejsce? Czy to jest bardziej takie podejście automatyczne, manualne, w jaki sposób to przepięcie na Zapasowe Centrum Danych się odbywa?

To jest rzeczywiście bardzo istotna kwestia. Systemy Disaster Recovery raczej projektuje się w ten sposób, żeby to przepięcie nastąpiło możliwie automatycznie. Oczywiście to wszystko zależy od wybranego scenariusza rozwiązania. Przy takich dużych rozwiązaniach, staramy się, żeby ten automatyzm zapewnić. W szczególności, jeżeli mamy architekturę wysokiej dostępności.

Tutaj ta różnica między Business Continuity a Disaster Recovery, czyli coś, gdzie to DRC na pograniczu tych dwóch pojęć się znajduje, to w Business Continuity tak naprawdę chodzi o zapewnienie ciągłości działania. W momencie, gdy następuje zdarzenie, gdy następuje jakaś awaria, to, że w skończonym czasie, jasno określonym, będziemy w stanie wrócić do tego działania, albo nawet kontynuować wszystkiego rodzaju obejściami nawet, podczas gdy w międzyczasie jest rozwiązywany problem, czyli w skrajnym przypadku, gdy klient ma serwerownię u siebie w biurze, jako taki ośrodek zapasowy używa serwerów dedykowanych w Data Center w Atmanie.

W przypadku na przykład braku zasilania w budynku biurowym i dłuższego powiedzmy także UPS-y nie podtrzymały nam tego zasilania i braku agregatów w tym biurowcu, następuje przełączenie w całości na infrastrukturę w Data Center Atmana.

Tak naprawdę, jak gdyby do tego momentu, cały czas mówimy o Business Continuity, natomiast w ramach procedur Disaster Recovery, kluczem tutaj jest jakby przywrócenie pierwotnego czy produkcyjnego działania. Disaster Recovery kończy nam się w momencie, jak prąd wraca i ta struktura produkcyjna jest w stanie funkcjonować. W rozmowach z klientami różne scenariusze analizujemy. Czasem rzeczywiście się zaczyna od tego typu scenariuszy, jak przedstawiłem przed chwilą, że klient zachowuje ten ośrodek produkcyjny u siebie, a później na bazie infrastruktury Atmana dobiera sobie Centrum Zapasowe.

Ze względu na to, jakiej jakości świadczymy usługi, to też często to się zmienia z czasem. Czyli nawet ten klient, który miał u nas tylko Centrum Zapasowe, stwierdza, że te warunki środowiskowe i jakość usług jest dużo wyższa, niż on jest w stanie zapewnić u siebie w siedzibie, w związku z tym tutaj jest lepsze zabezpieczenie jako produkcji, a nie Centrum Zapasowego.

Ewentualnie zapas jest utrzymywany właśnie we własnej serwerowni. Są też takie scenariusze, kiedy w naszych dwóch Centrach Danych, są dwie nogi takiego środowiska. W jednym ośrodek podstawowy, w drugim Data Center ośrodek zapasowy. Tutaj też ta lokalizacja ma znaczenie. Jak prowadziłem Webinarium dotyczące tej problematyki, podkreślałem, że dywersyfikacja wszelkiego rodzaju infrastruktury, technologii tez jest pożądana. Stąd rozróżnienie lokalizacji pod kątem tego, że w jednym miejscu może być energia, w drugim nie, czy w jednym może być internet, w drugim nie, jest jednym z takich istotnych elementów przy podejmowaniu decyzji o lokalizacji i wyborze Disaster Recovery Center.

Rozumiem. Powiedziałeś, że ten zapas może się na przykład znajdować w ramach serwerowni, w danej firmie. Czy tego typu rozwiązania lepiej budować właśnie samemu, w ramach wewnętrznego działu IT, czy też może skorzystać z usług zewnętrznej firmy?

To zawsze jest trochę pewien dylemat i pewien kompromis. Ciężko jest wybudować to, zupełnie nie angażując wewnętrznego IT. Tutaj zawsze będzie zaangażowany wewnętrzny zespół, który właśnie, chociażby wewnątrz firmy muszą zostać podjęte decyzje, na jakie scenariusze i w jaki sposób chcemy próbować się zabezpieczać. Na jakie problemy chcemy mitygować. Natomiast rzeczywiście pod względem budowania już takiego rozwiązania, tutaj warto skorzystać z zewnętrznych dostawców czy operatorów.

Tutaj jest o tyle cenna oferta Atmana, że rzeczywiście mamy w swoim portfolio produktowym dość szeroki zakres, jeżeli chodzi o infrastrukturę, bo są usługi dostępowe do internetu i transmisyjne, kolokacyjne, chmura publiczna i prywatne budowane serwery. Wiadomo, że przy wsparciu takiego operatora, profesjonalnej firmy, można uzyskać, dzięki efektowi skali oczywiście, dość wysoką jakość, w sensie SLA, optymalniejszym kosztem, gdybyśmy próbowali to budować samodzielnie.

Czy będąc taką firmą, która zdaje sobie sprawę z tego, że potrzebuje tego typu usług, chciałbym wybrać dostawcę tego typu usług? Na co powinienem zwrócić uwagę? Jakie kluczowe czynniki powinienem wziąć przy wyborze dostawcy tego typu usług?

Jedną z tych cech już wymieniłem podczas tej rozmowy. To rzeczywiście będzie pewnego rodzaju dywersyfikacja, czyli taki usługodawca, który pozwoli dobrać, czy też zaoferować mi różną infrastrukturę, od tego, co mam obecnie. Być może częściowo pokrywającą się z tym, czego używam w firmie.

Tak naprawdę to spektrum możliwości, które oferuje, że będzie wystarczająco szerokie, żeby z takiej oferty rozważyć kilka scenariuszy. Myślę, że w ogóle w biznesie i IT też jest bardzo ważne partnerstwo i zaufanie wzajemne. Tutaj też gdzieś szukałbym wsparcia w firmach, z którymi już dotychczas współpracujemy albo z których usług jesteśmy zadowoleni, albo słyszeliśmy, że rzeczywiście są to kompetentni specjaliści. Tak naprawę przy Disaster Recovery Center jest bardzo ścisła współpraca pomiędzy klientem, a dostawca takiego rozwiązania. W związku z tym musimy sobie ufać i wspólnie wypracować to finalne rozwiązanie.

Ile taka usługa kosztuje? Zdaję sobie sprawę, że nie powiesz mi konkretnej ceny, natomiast chciałbym bardziej się dowiedzieć o to, jakie czynniki kształtują cenę, co ma wpływ na tę finalną cenę?

Tutaj rzeczywiście rozpiętość jest bardzo duża i ciężko tak zupełnie w oderwaniu od jakiegoś konkretnego scenariusza to rozpatrzeć. Wrócę do tego, o czym zaczęliśmy, czyli od tego, jak IT wpływa na nasz biznes, na nasz core biznes. Jak ściśle są te dwa elementy powiązane. A w konsekwencji tego, jak bardzo, na jak wiele zagrożeń chcemy się zabezpieczyć?

Tak naprawdę można sobie wyobrazić, że można zupełnie odtworzyć drugie środowisko, takie samo. Jeżeli dysponujemy własnym sprzętem i go skolokujemy, podzielimy na ośrodki, to powiedzmy, że w przypadku takiej samej kolokacji, utrzymanie takiego zapasowego ośrodka będzie umiarkowanie drogie, w sensie nie będą to wysokie koszta. W przypadku, gdybyśmy chcieli kupować na potrzebę budowy nowego Zapasowego Centrum Danych, chcielibyśmy kupować serwery, to będą olbrzymie inwestycje. W skali wielu lat, dziesięciu, czy pięciu w górę, pewnie byłoby to opłacalne.

Tak naprawdę można sobie wyobrazić, że można zupełnie odtworzyć drugie środowisko, takie samo. Jeżeli dysponujemy własnym sprzętem i go skolokujemy, podzielimy na ośrodki, to powiedzmy, że w przypadku takiej samej kolokacji, utrzymanie takiego zapasowego ośrodka będzie umiarkowanie drogie, w sensie nie będą to wysokie koszta.

Ale jeżeli rozpatrujemy biznes, szczególnie w dzisiejszych czasach, w skali raczej miesięcy, lub kilku lat, to tak naprawdę dużo taniej jest wynająć, wydzierżawić serwery. Taką optymalizacją mogłoby być też skorzystanie z chmury obliczeniowej, gdzie po prostu możemy sobie dynamicznie takimi zasadami zarządzać i też w modelu PSU Go nie płacić za taką zapasową infrastrukturę, jeżeli z niej nie korzystamy. Takie scenariusze też można tu wdrażać. Takich klientów mamy również w Atmanie. Trzeba tutaj pamiętać o pewnych ograniczeniach. Gdzieś na początku ta infrastruktura świadczy, jest potrzebna pod systemy informatyczne, które mają być podtrzymane, czy które mamy przywrócić, te aplikacje z w miarę nową architekturą, to nie będzie problemu, żeby uruchamiać je na cloudach. Natomiast jeżeli mamy stare systemy, to tutaj jest bardzo ważne, żeby jednak umożliwić z jednej strony kompatybilność i być może będzie to wymagało fizycznej maszyny, a nie wirtualnego serwera. Co za tym idzie, może nam lekko podnosić koszty w przypadku, gdybyśmy mieli nowe rozwiązania. Natomiast nadal to nie jest tak, że nie da się zupełnie żadnego scenariusza Disaster Recovery Center uruchomić. Czasem są to przeplatające się różne scenariusze, na różnych warstwach w zależności od, że tak powiem, różnych systemów, które chcemy zabezpieczyć w firmie. Tutaj jest to dość złożona kwestia i koszty będą rzeczywiście w dużej mierze odzwierciedlać złożoność tego środowiska i wielość tych różnych usług, z których potrzebujemy skorzystać.

👉 Czytaj dalej na:

kkempin’s dev blog

Dev and life blog.

Medium is an open platform where 170 million readers come to find insightful and dynamic thinking. Here, expert and undiscovered voices alike dive into the heart of any topic and bring new ideas to the surface.

Follow the writers, publications, and topics that matter to you, and you’ll see them on your homepage and in your inbox.

If you have a story to tell, knowledge to share, or a perspective to offer — welcome home. It’s easy and free to post your thinking on any topic.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store