Data Center w czasie pandemii

Krzysztof Kempiński
Sep 17 · 12 min read
Image for post
Image for post

W ramach podcastu “Porozmawiajmy o IT” miałem okazję porozmawiać z Adamem Dzielnickim z firmy Atman o Data Center w czasie pandemii.

Posłuchaj naszej rozmowy w wersji audio 🎧 👇

Cześć! Mój dzisiejszy gość od prawie dwudziestu lat ułatwia biznesowi korzystanie z nowoczesnych usług ICT. Sprawia, że zaawansowane technologie stają się proste do zrozumienia i łatwe do sprzedaży. Obecnie rozwija produkty Data Center i SD-WAN w Atmanie. Mój dzisiejszy gość to Adam Dzielnicki.

Cześć Adam, miło mi gościć Cię w podcaście!

Witaj Krzysztofie, witam Państwa.

Z Adamem porozmawiamy sobie trochę o temacie technicznym, a trochę pandemicznym, ponieważ będziemy poruszać tematy jak Data Center , jak usługi Data Center , jak firmy realizujące tego typu usługi radzą sobie w czasie pandemii. Oczywiście na początku standardowe pytanie wprowadzające. Adam, czy słuchasz podcastów i jeśli tak, to jakich najczęściej?

Tak, Krzysztofie, słucham podcastów. To jest fajna forma, aby pozyskać tę wiedzę, posłuchać też co się dzieje na świecie. Wiadomo, nie wszyscy mamy tyle czasu ile byśmy chcieli, więc naprawdę to się sprawdza. Słucham różnych podcastów, ale takich, które gdzieś tam utkwiły mi w głowie i subskrybuję je chętnie, to jest na pewno Mała Wielka Firma, jest to podcast biznesowy. Dział zagraniczny, taki bardziej polityczno-społeczny i podcast Getting Thinks Done, który prowadzi, współprowadzi David Allen. To jest podcast o produktywności, o bezstresowej produktywności. Wszystkim polecam bardzo fajne materiały.

Świetnie, tego ostatniego nie znałem, ale z chęcią sobie zerknę. Dzięki za rekomendację. To może na początku tak spróbujmy zdefiniować, czym są nowoczesne centra danych i z jakich komponentów oprócz oczywiście infrastruktury technicznej się składają.

Można pokusić się o wymienienie kilku warstw, bez których nie byłoby możliwe świadczenie pełnych usług Data Center . Wymieniona w pytaniu warstwa infrastruktury technicznej ona jest bardzo istotna i służy utrzymaniu ciągłości działania usług w centrach danych. Na pewno warta wymienienia w jednej z pierwszych kolejności jest warstwa operacyjna.

Później mamy warstwę monitoringu, warstwę bezpieczeństwa fizycznego na przykład systemy kontroli dostępu czy też system gaszenia. Warstwa bezpieczeństwa teleinformatycznego to jest kolejna rzecz, która jest istotna, aby taki Data Center działał prawidłowo. Zapewniona ona jest przez zaawansowane Firewalle, różne systemy na przykład ochrony przed atakami DDoS. No i oczywiście warstwa usług telekomunikacyjnych, czyli światłowody, wszystkie urządzenia, które zapewniają tę telekomunikację w Centrach Danych.

Całkiem sporo tego jest. Kiedy sobie czytam albo słucham o Data Center , to bardzo często trafiam na takie pojęcie, jak „redundancja”. Chciałbym Cię zapytać, czym ona jest i w jaki sposób jest realizowana w nowoczesnych Centrach Danych?

Redundancja to zgodnie ze słownikiem języka polskiego jest pewnym nadmiarem w stosunku do tego, co niezbędne. Czyli z jednej strony by pewna nadmiarowość, która może być niepożądana, ale w wypadku Data Center jest niezbędna do podniesienia dostępności usług. W Centrach Danych redundancja realizowana jest poprzez takie projektowanie systemów, tak aby te systemy były odporne na awarie poszczególnych komponentów.

Takim obrazowym przykładem redundancji jest koło zapasowe w samochodzie, nieraz ono jest zwane kołem dojazdowym. Niemniej jednak w wypadku koła dojazdowego, musimy liczyć się z tym, że wymiana koła chwilę potrwa i parametry jazdy z tym kołem będą troszeczkę inne, na pewno gorsze niż jazdy z takim kołem pełnowymiarowym.

W Centrach Danych niemniej jednak nie mowy o tym, aby w wypadku uszkodzenia jakiegoś pojedynczego komponentu, takiego właśnie komponentu redundantnego. Trzeba było cały system wyłączyć tak jak w przypadku samochodu zatrzymać go. Przy wymianie wszystkie systemy muszą pracować, więc to jest tak zorganizowane, że mimo tego, iż jakiś komponent jest wymieniany, to jednak cały system pracuje i dostarcza wymaganą funkcjonalność.

Co więcej, po wymianie też i podczas tej wymiany nie może być mowy o tym, że te parametry pracy będą inne, odchylone, gorsze niż przy dawaniu. Wszystkie systemy muszą się przełączać Data Center automatycznie. Systemy dbają też o to, by te nadmiarowe komponenty pracowały rotacyjnie, to znaczy na przykład jednostka klimatyzacyjna równomiernie się zużywała, to jest bardzo ważne. Dzięki czemu ta infrastruktura pracuje równomiernie, dostarcza te parametry, które są niezbędne do tego, aby serwery w Centrach Danych pracowały bezpiecznie i długo.

Rozumiem. To bardzo fajna rzeczywiście analogia do koła dojazdowego. Jakie elementy jeszcze, powiedziałbym dodatkowe, oprócz tej nadmiarowości, oprócz tej nadmiarowej infrastruktury serwerowej trzeba wziąć pod uwagę, planując i później prowadząc też zarządzania Data Center ?

No właśnie, infrastruktura techniczna to nie jest wszystko. Wydawałoby się, że systemy chłodzenia, bezpieczeństwa, podtrzymania zasilania to jest to, co sprawia, że Data Center może samodzielnie pracować. Okazuje się, że jednak nie. Kluczowe są procesy, które muszą być skrojone pod dany ośrodek przetwarzania danych. Inaczej wygląda obsługa małej serwerowni, a inaczej obsługa i utrzymanie Centrów Danych w skali Atmana, który w samej Warszawie posiada dwa niezależne kampusy połączone kilkoma trasami światłowodowymi.

W wypadku komercyjnej Data Center znaczenie ma też to, w jakim standardzie oferowane są usługi dla klientów końcowych i to, z kim ci klienci końcowi są. Inne podejście będzie w wypadku obiektów świadczących usługi dla małych firm, a inne dla dużych kampusów obsługujących poważne instytucje finansowe, na przykład banki, ubezpieczalnie, czy na przykład biura maklerskie.

Inne zupełnie wymagania będą dla klientów, którzy są tak zwanymi hyper scalerami, czyli takimi dużymi, globalnymi dostawcami chmur obliczeniowych. Kolejny aspekt to jest jaki Data Center standard SL’a utrzymuje, bądź, co może wydawać się prozaiczne, ale w gruncie rzeczy jest ważne na końcu, mianowicie, jak realizowany jest fizyczny dostęp do obiektu. To znaczy czy obiekt ma być dostępny 24 godziny na dobę, czy można go odwiedzać tylko i wyłącznie w godzinach biznesowych. Tak jak niektóre serwerownie jeszcze w Polsce operują.

Jasne. Jeśli chodzi o takie nowoczesne Centra Danych, to dużo się mówi o przestojach w świadczeniach usług. Dużo się też robi, żeby w jakiś sposób im przeciwdziałać.

Jednak wiadomo, że nie da się zupełnie w 100%, gdyby gdzieś tam byli, nawet gdzie jest to taki ciągły proces. Chciałem Cię zapytać, z czego mogą wynikać przestoje w świadczeniu usług przez Centra Danych? Może są jakieś badania, które pokazują główne powody? Jak istotne jest to, żeby unikać tego typu przestojów, jaka jest skala tego problemu?

Jasne. Infrastruktura techniczna mimo tego, iż ona jest pomyślana w ten sposób, aby dostarczała najwyższa możliwą dostępność, jest czymś jednak fizycznym, co jednak może się zepsuć. Zdarzają się różnego rodzaju zakłócenia, które nie były przewidziane przez konstruktorów, inżynierów. Takie zdarzenia niestety się zdarzają, trzeba być tego świadomym. Dotykają one najczęściej obiektów, w których nie ma wprowadzonych spójnych procesów i procedur operacyjnych, ponieważ to uszkodzenie, spadek redundancji gdzieś w infrastrukturze w Centrum Danych, on dla klienta końcowego nie powoduje żadnego problemu, dopóki ta awaria nie przyniesie się dalej.

Dopóki Data Center posiada procedury jak zareagować na takie sytuacje, to wszystko jest pod kontrolą i tak naprawdę dostępność dla klienta końcowego jest niezakłócona. Pytałeś o badania, są takie badania prowadzone. Jednym z takich na przykład badań jest badanie prowadzone przez firmę Uptime Institute. To badanie nazywa się Publicly Reported Outages. Z tego badania, które zostało zrealizowane na bazie roku 2018/2019, jasno wynika, że za 32% tych zdarzeń odpowiadają złożone incydenty związane z energią chłodzenia, czy też systemem gaszenia.

Zazwyczaj źródła takich incydentów są wielorakie. Rzadko są one spowodowane jedną przyczyną. Najczęściej też mają taki charakter kaskadowy, który pokazuje w tych krytycznych momentach słabość w wyszkoleniu ludzi, wyszkoleniu inżynierów, a szczególnie przygotowaniu ich na krytyczne zdarzenia czy też po prostu okazuje się, że firma nie posiada wdrożonych dobrych praktyk w ramach procesów operacyjnych czy też zarządczych.

Bardzo istotne jest też unikanie takich przestojów. Pomocne w tym są zarówno regularne przeglądy infrastruktury, bo tę infrastrukturę trzeba na bieżąco sprawdzać, czy ona działa prawidłowo, czy nie trzeba jakiegoś meitenesu. Łatwo go wykonać, ale też trzeba regularnie realizować i wykonywać testy systemów zabezpieczeń tudzież ćwiczenia kadry operacyjnej. Podobnie jak w wypadku takiego ćwiczenia pożarowego w budynku biurowym, takie ćwiczenia w profesjonalnych Centrach Danych kadry, operacyjnie też się przeprowadza. Dzięki takiemu podejściu znacząco obniża się prawdopodobieństwo materializacji ryzyka, zaś nawet w wypadku incydentu jesteśmy jako organizacja przygotowani na odpowiednią reakcję, która zminimalizuje wpływ zdarzenia na klienta końcowego. Tak jak w życiu doświadczenie i właściwe przygotowanie gra najważniejszą rolę. Jeśli chodzi o skalę to w tym wspomnianym badaniu, które obejmowało praktycznie trzy lata zdarzeń, przytoczono 57 krytycznych incydentów w skali globalnej. Oczywiście mowa tu o incydentach, które były upublicznione i dotyczyły najczęściej ośrodków komercyjnych, więc sama skala nie jest duża. Jednak ze względu na istotność infrastruktury i tych danych, które się przetwarzają w Centrach Danych, jest to coś, co jest oczkiem w głowie zarządzających w Centrach Danych i w świadomy sposób tym ryzykiem należy zarządzać.

Jasne. A czy branża powiedzmy, rozumiana jako całość, stara się w jakiś sposób wypracować pewne dobre praktyki, jakoś radzić sobie z tego typu problemami, czy w jakiś sposób branża dzieli się, powiedzmy wiedzą albo ustala standardy?

Tak. Po części organizacje certyfikujące są takimi działami edukacyjnymi. Niemniej jednak dobrą robotę wykonują to także dostawcy technologii. Warto tutaj wspomnieć na przykład o naszej współpracy z jednym z największych na świecie dostawców technologii chłodzenia i zasilania gwarantowanego, firmie Vertiv. Razem z Vertiv zbudowaliśmy unikalne w skali Europy laboratorium technologiczne, w którym możliwe jest zasymulowanie krytycznych sytuacji tak, aby można było po pierwsze lepiej zrozumieć, jak reagują systemy na takie niestandardowe parametry, a po drugie, aby spróbować zoptymalizować procesy utrzymaniowe.

Zarówno w wymiarze ryzyka, jak i kosztu. Myślę tutaj szczególnie o systemach chłodzenia, gdzie każda optymalizacja wskaźnika to wymierna oszczędność dla klienta końcowego. Nie bez przyczyny wspomniałem też o organizacjach certyfikujących, gdyż od jakiegoś czasu współpracujemy z jedną z nich.

Mówię tutaj o EPI, który jest autorem standardu DCOS. To się rozwija jako Data Center Operations Standard. Ten standard jest dobrym przykładem na to, w jaki sposób branża Centrów Danych dzieli się sprawdzonymi praktykami. Standard DCOS został opracowany między innymi we współpracy ze specjalistami takich firm jak Microsoft, Ericsson, Dell, czy też polską firmą BCA Group, z która także współpracujemy. W tego typu opracowaniach, standardach jest zawarta wiedza, która jest żywa. Te standardy są aktualizowane, więc to jest miejsce, z którego także my czerpiemy i czerpie cała branża.

Gdybyś mógł powiedzieć, ten Standard DCOS jakie obszary obejmuje? Czy dane Data Center musi działać według najwyższych standardów we wszystkich z tych obszarów, żeby dostać taką certyfikację?

Akurat Standard DCOS jest bardzo rozległym Standardem. On pokrywa aż 11 tak zwanych dyscyplin, do których między innymi należą takie obszary jak zarządzanie poziomem jakości usług, monitoring, raportowanie i kontrola, zarządzanie obiektem, czy też operacje Centrów Danych i inne.

Dla uzyskania certyfikacji, która w ramach tego standardu potwierdza poziom tak zwanej dojrzałości organizacji w danym obszarze. Nie jest wymagana certyfikacja wszystkich dyscyplin, ponieważ taka certyfikacja trwałaby bardzo długo i robi się to stopniowo. Przy takim podejściu maksymalna możliwa ocena do otrzymania to tak zwany poziom czwarty, czwarty poziom dojrzałości i my w Atmanie certyfikując wybrane obszary, właśnie na takim poziomie działamy. Niemniej jednak dostrzegamy też, że rozciągnięcie tej certyfikacji, tego standardu na pozostałe obszary jest ważne, istotne i dodaje wartość dla usług, które świadczymy dla naszych klientów końcowych.

W kolejnych kwartałach, czy też latach będziemy implementować także pozostałe dyscypliny. Oczywiście na świecie są przykłady Centrów Danych, które działają w wybranych dyscyplinach na niższych poziomach dojrzałości, niż czwarty i tak naprawdę wszystko zależy od przyjętej polityki firmy i tego, jak bardzo chce dana firma inwestować w utrzymanie standardu operacji. My chcemy, my dbamy, jest to w naszym DNA.

Rozumiem. Czy oprócz standardu EPI-DCOS, którego certyfikacje jako Atman posiadacie, są jeszcze jakieś inne standardy, które są sprawdzone, używane w branży Data Center , jeśli chodzi o jakość, stabilność świadczonych usług?

Tak. Na rynku można spotkać certyfikację firmy Uptime Institute, która zarówno certyfikuje infrastrukturę, jak i obszar operacji, choć są to zupełnie różne certyfikacje. Dla infrastruktury technicznej często operatorzy Data Center wybierają też certyfikacje NCT, która ocenia poziom standardu systemowego. Niemniej jednak według nas, wysoki standard operacji, powtarzalność proceduralna, kontrola i bieżący monitoring dodają największą wartość dla oferowanego produktu, dla kolokacyjnych usług Data Center.

Co więcej, poprawiają one jakość nie tylko usług lokacyjnych, ale także usług, które także budowane są w oparciu jako lokacja. To znaczy w naszym wypadku usługi serwerów dedykowanych, czyli takich serwerów, które można wynająć na ściśle określony czas, bądź na dowolnie wyspecyfikowany przez klienta, czy też chmury obliczeniowej. Na końcu więc zyskują też klienci, którzy korzystają z naszych usług końcowych i rozwiązań.

Na wstępie powiedziałem, że będziemy rozmawiać o temacie zarówno technicznym, jak i pandemicznym. Myślę, że teraz pora przejść do tej drugiej części.

Chciałem Cię zapytać o to, jak sytuacja z COVID-19 wpłynęła na firmę taką jak Atman na przykład, świadczące usługi Data Center ? Czy coś się zmieniło? A jeśli tak, to, jak zmieniło się zapotrzebowanie w ogóle, na tego typu usługi?

Mieliśmy okazję obserwować jako społeczeństwo mocne przesunięcie, mocny shift w kierunku wykorzystania usług cyfrowych, więc jestem ciekawy czy Wy również obserwowaliście rosnące zapotrzebowanie na tego typu usługi, jak kolokacja właśnie, chmura obliczeniowa, czy serwery dedykowane. Jak to wygląda, a jak to wyglądało?

Tak, zauważyliśmy i potwierdza to też nasze badanie Biznes w czasie pandemii. Nasi klienci, którzy są klientami biznesowymi, znacznie przyspieszyli projekty transformacji IT.

Mówi się o tym, że to, co było realizowane kiedyś w ciągu dwóch lat, to te firmy zmaterializowały w ciągu dwóch miesięcy, więc to naprawdę bardzo duży skok i ta sytuacja, mimo że sytuacja dosyć krytyczna dla biznesu, dla ciągłości działania, dla łańcucha dostaw, jednak istotnie tutaj dużo dobrego zrobiła, jeśli chodzi o transformację, rozwój IT.

Ponad 53% firm, które odpytaliśmy, dostrzegło, że technologie IT znacząco pomogły im przetrwać kryzys wywołany ograniczeniami związanymi z pandemią. Wprowadzenie na szeroką skalę pracy zdalnej, jako formy wykonywania zadań służbowych, też gdzieś tam wymaga skorzystania z rozwiązań chmurowych, które nomen omen są dostarczane z takich obiektów jak nasze Data Center.

To dla nas oznacza, że mamy większy popyt na tego typu usługi. Bardzo często okazuje się, że ten popyt jest tak duży, że nawet branża w Polsce nie nadąża nad dostarczeniem danych rozwiązań dla klientów, którzy oczekują tych komponentów do swojej transformacji.

Myślę, że to jest dla IT, dla dostawców infrastruktury IT czas troszeczkę takich żniw. Ale też miejsce, gdzie możemy dużo dobrego zrobić, jeśli chodzi o consulting, o doradzanie klientom, to w jaki sposób rozwijać swoje procesy IT, w którym kierunku iść, gdzie się też uniezależniać od pewnych takich czynników zewnętrznych, które mogą powodować, że jednak te procesy w firmie mogą gdzieś tam się stopować, mogą się blokować.

Dokładnie, myślę, że rola i znaczenie, ale też odpowiedzialność takich firm znacząco wzrosła. Chciałem Cię jeszcze zapytać w tym temacie, czy to raczej jest tak, że pojawia się więcej po prostu klientów, którzy są świadomi, albo zmuszeni wręcz do działania teraz on-line, czy też raczej obecni mocniej wykorzystują już to, co mają, czyli na przykład zasoby chmurowe, czy swoją infrastrukturę? Czy jesteś w stanie tutaj coś powiedzieć?

Moim osobistym zdaniem, ci klienci, którzy zaczynają takich rozwiązań szukać, to są klienci, którzy już kiedyś podejmowali pewne próby przeniesienia swoich procesów operacyjnych do chmury, wyrzucenia gdzieś tego na zewnątrz do profesjonalnych Centrów Danych, do profesjonalnych systemów.

Niemniej jednak te próby ze względu na to, że nie było może takiego stanu wyższej konieczności, one nie miały tyle atencji, co podczas pandemii i niejako zostały te firmy przymuszone, żeby odkurzyć te pomysły, odkurzyć te projekty i jednak wdrożyć je do końca. Okazuje się, że wdrożenie tego typu rozwiązań do firm przynosi wymierne efekty, jest optymalizacja. Ta optymalizacja nie wyraża się często w tym, że można kogoś zwolnić, tylko wyraża się w tym, że ta osoba, która do tej pory realizowała jakieś funkcje czysto administracyjne, gdzie był duży narzut takiej pracy, którą łatwo zautomatyzować, nagle odzyskuje przestrzeń i może zrobić bardziej kreatywne rzeczy dla firmy, rzeczy, które przynoszą dużo wyższą wartość. I to jest jakby ten uzysk, ta dobra strona tego, co się zadziało w przeciągu ostatnich kilku miesięcy w obszarze IT.

Dokładnie. Dodałbym jeszcze może do tego, że ta sytuacja z pandemią pokazuje, że w ogóle się da, że to, co wcześniej było w jakiś sposób blokowane, tak powiedziałeś, na poziomie decyzyjnym, być może na poziomie nawet jakiegoś researchu technologicznego. Nagle okazało się, że jest to możliwe i tak jak tutaj też zaznaczyłeś, da się to zrobić stosunkowo szybko, bez kilku lat przygotowań i tej tranzycji i wszystkich procesów, które się z tym wiążą.

Tak, bardzo podobnie, jak w wypadku rozwoju osobistego, firmy musiały po prostu wyjść ze strefy komfortu. Okazało się, że ten nadzór managerski nie musi być nadzorem takim fizycznym, wiele rzeczy można realizować w sposób zadaniowy i to też pomaga w tej tranzycji i rozwoju naszego rynku polskiego.

A jak zmieniło się samo działanie Centrów Danych, jako takich? Chodzi mi tutaj o zarządzanie Data Center , ale również o kadrę, która za tym stoi, klientów korzystających, chociażby z kolokacji, bo sytuacja z COVID-19 dotknęła wszystkie te obszary, przypuszczam?

Od strony operacyjnej byliśmy przygotowani na drobne korekty. Gdy pandemia gdzieś już tam w tle się pojawiała, to rozpoczęliśmy przygotowywanie się do tego scenariusza. Wprowadziliśmy między innymi coś takiego jak separacja zespołów utrzymaniowych.

Zadbaliśmy o to, aby na terenie kampusu wszyscy bez wyjątku zaczęli używać środków ochrony osobistej, to jest maseczek, przyłbic, rękawiczek jednorazowych, środków dezynfekujących i ograniczyliśmy też znacząco liczbę roboczych wizyt poprzez wprowadzenie bezpłatnych usług remote hands dla naszych klientów. Czyli takich usług, które nie wymagają stawiennictwa się klienta w Centrum Danych.

My drobne prace w ramach tych usług dla klientów wykonujemy, czyli na przykład restartujemy serwery, sprawdzamy stan kontrolek na serwerach. Jesteśmy w stanie pewne czynności dla klientów zdalnie wykonać. Do tej pory, jeśli chodzi o zorganizowanie pracy w naszej firmie, obowiązuje też zdalna forma pracy dla pracowników spoza zespołów utrzymaniowych. Niemniej jednak obserwując tylko wskaźniki operacyjne i techniczne dostępności to nie sposób się domyślić, że nasz modus operandi jakoś się zmienił. Usługi nadal są dostarczane na niezmiennie wysokim poziomie. W dużej części jest to właśnie zasługa tych standaryzacji, operacji poprzez wprowadzenie standardu DCOS.

👉 Czytaj dalej na: https://porozmawiajmyoit.pl/poit-081-data-center-w-czasie-pandemii/

Medium is an open platform where 170 million readers come to find insightful and dynamic thinking. Here, expert and undiscovered voices alike dive into the heart of any topic and bring new ideas to the surface. Learn more

Follow the writers, publications, and topics that matter to you, and you’ll see them on your homepage and in your inbox. Explore

If you have a story to tell, knowledge to share, or a perspective to offer — welcome home. It’s easy and free to post your thinking on any topic. Write on Medium

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store