It’s Open O’clock! 5 lat wokół otwartych danych

Jeszcze kilka-kilkanaście lat temu, mało kto w Polsce wiedział, czym są otwarte dane. Jak to wygląda obecnie? Czy o otwartych danych mówi się więcej i częściej? Czy ich wartość jest coraz mocniej odczuwalna w społeczeństwie i biznesie?

Transparent Data
Blog Transparent Data
10 min readAug 28, 2018

--

Jeżeli ktokolwiek potrafi udzielić odpowiedzi na te pytania, są to nasi gościnni eksperci — Pełnomocnik Ministra Cyfryzacji ds. Otwartości Danych i jednocześnie Dyrektor Departamentu Otwartych Danych i Rozwoju Kompetencji, Agata Miazga, założyciel i prezes najbardziej aktywnej w obszarze open data polskiej organizacji pozarządowej, Fundacji ePaństwo, Daniel Macyszyn oraz doskonale znany z podcastów Openity, Tomasz Nadolny, który przez lata otwierał dane miasta Gdańsk, dziś będącego open city nr 1 w naszym kraju. Swoje “dwa słowa” wtrąca również nasz CEO, Arkadiusz Hajduk.

Artykuł z cyklu #Transparent Five na 5-lecie Transparent Data

Najnowszy artykuł z cyklu #TransparentFive na 5-lecie istnienia Transparent Data w pełni poświęcamy temu, co za rozwiązaniami dla biznesu napędza naszą firmę — otwartym danym.

Cofnijmy się 5 lat wstecz

Czy terminy “otwarte dane” i “open data” w ogóle istniały wówczas w polskiej mentalności? A może nadal, mimo popularyzacji idei smart cities i cyfryzacji publicznych danych, tylko wąskie grono specjalistów korzysta z tych zwrotów?

Tomasz Nadolny: 5 lat temu, poza kilkoma organizacjami pozarządowymi, wąskim gronem naukowców, informatyków i może niewielkiego grona urzędników krajowego szczebla i samorządów nikt się tym nie zajmował. Dziś jednak istnieją już stałe i stabilne zbiory danych, z których korzystają zarówno NGOsy jak I biznes komercyjny. Temat jest w agendzie ministerstwa, sporo samorządów gorzej lub lepiej postawiło pierwsze kroki.

Niewątpliwie wzrosła ilość osób, które znają pojęcie otwartych danych i wiedzą na czym to polega. Znacznie gorzej jest popularyzacją zarówno ich udostępniania jak i używania.

Szczerze mówiąc, 5 lat temu byłem przekonany, że pójdzie nam szybciej i szerzej. Nie raz i nie dwa polska historia pokazała, że bardzo szybko potrafimy adoptować innowacyjne rozwiązania. W tym przypadku, rozwój jest wolniejszy niż się spodziewałem. Cieszy jednak to, że nieustannie pojawiają się nowe usługi i rozwiązania oparte na otwieranych danych. Choć jeszcze nie nazwałbym tego wyraźnym trendem, to jednak rośnie zainteresowanie i zaangażowanie zarówno użytkowników, jak i właścicieli danych.

Agata Miazga: Pracujemy nad tym. Coraz więcej osób — zarówno w administracji, jak i środowiskach biznesu czy nauki — zdaje sobie sprawę, że w obszernych zasobach danych publicznych kryje się ogromny, nie do końca jeszcze odkryty, potencjał. Ich otwarcie to szansa na nowe zastosowania w usługach czy aplikacjach. To również nowe firmy i nowe miejsca pracy.

Na portalu danepubliczne.gov.pl, który za moment przemianujemy na dane.gov.pl, udostępniamy coraz więcej danych — w sierpniu liczba otwartych zasobów wyniosła ponad 10 tys. W ostatnim roku liczba odsłon wzrosła o 70%, a liczba pobrań odnotowała niemal 2,5-krotny wzrost. To dowód, że otwarte dane publiczne stają się towarem coraz bardziej pożądanym.

Daniel Macyszyn: O otwartych danych mówi się coraz więcej, głównie w sferze biznesu i administracji publicznej.

W Ministerstwie Cyfryzacji powstał departament otwartych danych, który ma ambicje przeprowadzenia śmiałych projektów otwierania rejestrów publicznych i budowania na ich podstawie usług dla obywateli i biznesu. W obszarze miast, liderem jest Gdańsk, który wdrożył politykę otwartości i aktywnie zajmuje się udostępnianiem danych będących w posiadaniu ratusza.

Organizacje biznesowe również w coraz większym stopniu upominają się o możliwość korzystania z danych wytwarzanych przez administrację publiczną. Coraz więcej z nich postrzega dostęp do danych publicznych jako element infrastruktury państwa, podobnie jak dostęp do autostrad. Postęp dokonał się w pracy organizacji społecznych i biznesowych, które przetwarzają dane coraz bardziej pomysłowo i w sposób użyteczny dla swoich odbiorców.

Arkadiusz Hajduk: Przyznam szczerze, że kiedy startowaliśmy 5 lat temu z pierwszym serwisem agregującym otwarte dane, kompletnie nie używaliśmy tego terminu nawet. Były dane publiczne, ale nigdzie nie pojawiało się określenie “otwarte dane”. Czytaliśmy zagraniczne publikacje o open data, jeździliśmy na Open Data Summit i “tłumaczyliśmy” to sobie na nasze warunki. W kraju były takie jaskółki jak np. Otwarty Gdańsk, Fundacja ePaństwo i my, jako Transparent Data, dołączyliśmy do tego grona.

Teraz możemy rozmawiać o otwartych danych w o wiele szerszym gronie, ale myślę, że dzisiaj jesteśmy dopiero na początku początka drogi do efektywnego wykorzystania otwartych danych w Polsce.

A dziś, po 5-u latach

Czy przeciętny Polak, Pan Kowalski, potrafi wyjaśnić czym są open data? Zna ich definicję? Korzysta z nich?

TN.: Niestety nie. Co prawda branża programistyczna, w ciągu ostatnich 5 lat się bardzo rozrosła i ona ma świadomość, ale przeciętny Kowalski nie rozumie na czym polega ich “otwartość” i dostępność, a co za tym idzie, niezbyt często potrafi artykułować potrzebę otwierania.

DM.: Przeciętny Polak nie potrafiłby wyjaśnić czym są ”open data”. Wielu Polaków korzysta natomiast z produktów i usług zbudowanych z wykorzystaniem otwartych danych. Nie ma w tym niczego dziwnego — przeciętny użytkownik produktów bankowości elektronicznej też nie ma większego pojęcia o kryptologii. Wiedza o “open data” nie jest powszechna, ale wykorzystanie usług opartych o nie — rośnie.

AM.: Przeciętny Polak, często nieświadomie, korzysta z efektów otwartych danych na co dzień, na przykład sprawdzając w aplikacji rozkład jazdy, poziom zanieczyszczenia powietrza czy prognozę pogody.

Natomiast samą definicję otwartych danych powinien znać nie tyle Pan Kowalski, co urzędnik, który za przygotowywanie, przetwarzanie i udostępnianie danych odpowiada. Dlatego prowadzimy kolejny już cykl szkoleń dla pracowników administracji, w czasie których mogą zapoznać się z zasadami i trybem dostępu do informacji publicznej, dobrymi praktykami otwierania danych i technicznymi aspektami ich udostępniania. Wkrótce będziemy też szkolić ze świeżo opracowanych w MC standardów otwartości danych, czyli wytycznych dla osób otwierających dane w 3 wymiarach: regulacji prawnych, bezpieczeństwa i technicznym.

Kroki milowe Polski w obszarze open data

Gdyby tak podsumować ostatnie 5 lat działań sektora państwowego na rzecz otwierania publicznych danych, jakie były kroki milowe? Jakie kluczowe aktywności podjął polski rząd? Mało czy dużo się zmieniło?

AM.: Od tego czasu wiele się zmieniło. W 2016 r. opracowaliśmy rządową strategię otwartych danych, czyli Program Otwierania Danych Publicznych na lata 2016–2020 (PODP). Żeby skutecznie ją realizować, zbudowaliśmy sieć Pełnomocników ds. otwartości danych, obejmującą wszystkie ministerstwa, KPRM i GUS. Pełnomocnicy zapewniają zasilanie portalu nowymi danymi, czuwają nad ich jakością i pełnią w swoich urzędach rolę „ambasadora” otwartych danych.

Zorganizowaliśmy też pierwszy rządowy maraton programowania: Hackathon danych publicznych, podczas którego 90 uczestników pracowało nad prototypami aplikacji bazujących na otwartych danych, udostępnionych na portalu. Ten pierwszy hackathon był dla nas bardzo ważnym doświadczeniem — zderzyliśmy nasze postrzeganie otwartych danych z potrzebami i oczekiwaniami odbiorców. W tym roku odbędzie się druga edycja wydarzenia.

Rozwijamy również sam portal danepubliczne.gov.pl, który będzie miał już wkrótce nie tylko nowy wygląd i domenę, lecz także nowe funkcjonalności, które ułatwią obywatelom swobodny dostęp do danych. Na portalu można znaleźć wiele zbiorów gotowych do pobrania i ponownego wykorzystywania (re-use), w tym m.in. z zakresu zdrowia, budżetu, oświaty czy turystyki. Dane do portalu dostarcza już ponad 100 instytucji, także samorządowych.

Czyli otwieramy kolejne dane. A czy wyciągamy korzyści z ich otwierania?

Pytamy tu o historie realnego wykorzystania open data w praktyce z ostatnich 5 lat. Jakieś przykłady, które otworzyłyby oczy tym, którzy nadal twierdzą, że otwieranie danych to coś, co nie wnosi żadnej wartości?

DM.: W ciągu ostatnich lat pojawiło się wiele usług i produktów wykorzystujących otwarte dane. Niektóre z nich okazały sukcesami komercyjnymi — np. bazy danych gospodarczych (https://przeswietl.pl/), systemy dostępu do informacji prawnych (http://www.lex.pl/ ) czy aplikacje ułatwiające korzystanie z transportu publicznego (https://jakdojade.pl/ ).

Wartość niektórych zasobów otwartych danych dla biznesu jest więc bezsprzeczna.

Inne dane są z powodzeniem wykorzystywane przez obywateli dla dobra publicznego. Coraz więcej miast udostępnia rejestry zawieranych umów, co tworzy presje na urzędników do rozsądnego wykorzystywanie środków publicznych. Głośna dzisiaj sprawa nieszczelności systemu VAT została odkryta dzięki analizom organizacji biznesowych i społecznych w oparciu o otwarte dane z Ministerstwa Finansów.

TN.: Może to zabrzmi dziwnie, ale za dobry przykład wykorzystania otwartych danych w biznesie uważam masowe używanie bazy przedsiębiorców, celem uszczelniania ściągalności podatku VAT. Z kolei dla przeciętnego użytkownika, to dane pogodowe I transportowe, w tym dane komunikacji publicznej w dużych miastach, stanowią najszerzej używane zbiory danych.

Ja niestety ciągle mam niedosyt i z zazdrością zawsze patrzę na kolegów I koleżanki za oceanem, którzy mogą rzeczywiście próbować szukać rozwiązań problemów, mając otwarte rejestry usług medycznych, transakcji na rynku nieruchomości czy bezdomności, przestępczości. Myślę, że najlepsze takie przykłady są dopiero przed nami.

Otwarte dane w Polsce vs. za granicą

Czy można mówić, że Polska plasuje się na globalnym poziomie open data czy też mocno odbiega od liderów światowych rankingów?

TN.: Według rankingu Open Data Index, nie jest tak źle, bo mamy 28 lokatę a w 2015 roku w ogóle nas w tym rankingu nie było. Ale można też zobaczyć jakie ciekawe dziedziny danych są pootwierane w państwach, które są od nas wyżej. Na pewno jest wiele krajów, które w tym względzie są w gorszej sytuacji niż my, ale patrzmy w górę, a nie w dół.

AM.: Dzięki realizowanym działaniom poprawiliśmy pozycję Polski w międzynarodowych rankingach. W ostatnim rankingu OECD Open, Useful, Reusable Government Data (OURDATA INDEX), opublikowanym w raporcie Government at a Glance 2017, Polska w porównaniu z 2015 r. awansowała o 8 pozycji i zajęła 20 miejsce na 31 badanych krajów. Także Komisja Europejska odnotowała szybki wzrost i poprawę dostępności danych publicznych w Polsce — w rankingu UE „Open Data Maturity 2017” Polska awansowała z grupy „obserwatorów” do grupy „fast — trackers”.

Wciąż rozwijamy się i gonimy leaderów, ale przed nami jeszcze dużo pracy, jeśli chcemy (a chcemy) znaleźć się w gronie najlepszych.

DM.: Pozycja 20 na 31 za rok 2017 nie jest niestety pozycją wysoką. Nie można jednak nie docenić zwłaszcza ostatnich wysiłków Ministerstwa Cyfryzacji. Opracowywane zostały podstawy prawne i standardy. Pierwsze projekty ruszyły, a plany na przyszłość mają potencjał przesunięcia nas w stronę liderów (program Otwarte Dane +). Trzymamy za to kciuki.

Przyszłość otwartych danych w Polsce

Jakie najważniejsze rzeczy zostały do zrobienia? Co powinno być naszymi priorytetami w otwieraniu danych w najbliższych latach?

TN.: Ustalić standardy, tak aby kolejne modernizacje, upgrades oprogramowania, inwestycje z państwowej kasy, na każdym szczeblu, sprawiały, że da się potem te dane otwierać, że systemy mogą ze sobą rozmawiać. To stała bolączka wydawanych na informatyzację środków, że mimo istnienia krajowych ram interoperacyjności, w praktyce mało kto się tym przejmuje.

DM.: Polska administracja publiczna jest zbudowana “silosowo”, co wpływa również na korzystanie z jej danych. Jedną z wartości dodanych, które kreuje dostęp do otwartych danych jest możliwość łączenia danych, pochodzących z różnych baz. Obecnie jest to utrudnione poprzez brak interoperacyjności systemów informatycznych powstających w różnych jednostkach administracji. Np. automatyczne łączenie informacji o zwycięzcy publicznego przetargu z jego danymi z bazy CEIDG jest trudne, a czasami niemożliwe. Pomogłoby egzekwowanie standardów wymiany danych pomiędzy poszczególnymi systemami.

Co więcej, istnieją zidentyfikowane zbiory danych “dużej wartości”, które nie zostały jeszcze otwarte, a w których drzemie potencjał. Są to np. dane z Krajowego Rejestru Sądowego, dane meteorologiczne, dane z ksiąg wieczystych i rozkłady jazdy komunikacji publicznej.

W niektórych przypadkach, otwieraniu rejestrów towarzyszą obawy o ochronę innych wartości (np. ochronę danych osobowych). W innych przypadkach opory wydają nam się nieuzasadnione. Ciężko zrozumieć np. dlaczego obywatele i przedsiębiorcy nie mogą swobodnie przetwarzać danych z rozkładu jazdy pociągów PKP.

W niektórych obszarach nadal można zaobserwować opór mentalny ze strony urzędników. Spotkaliśmy się z określaniem ponownego wykorzystywania danych publicznych jako “wypompowywania danych z urzędu”, czy próbami korzystania z prawa autorskiego w celu zablokowania dostępu do informacji.

AM.: Z pewnością potrzebna jest kontynuacja naszych dotychczasowych przedsięwzięć: współpracy z dysponentami najbardziej poszukiwanych danych, zwłaszcza tych, które mogą być udostępniane dynamicznie, przez API, a także edukowania pracowników zajmujących się danymi publicznymi.

Równie ważne, jak rozwijanie umiejętności pracy z danymi i wiedzy o otwartych formatach, są zmiany świadomościowe. Chcielibyśmy, żeby postrzeganie danych publicznych jako dobra wspólnego stało się w administracji publicznej powszechne.

Powinniśmy także pamiętać o drugiej, popytowej stronie, czyli odbiorcach otwieranych przez nas danych. W Polsce nie ma wciąż kultury pracy z danymi ani wystarczających umiejętności. Wykorzystywanie danych, nie tylko publicznych, w przedsiębiorstwach jest znikome. Dlatego tak istotna jest promocja re-use danych publicznych i ścisła współpraca ze środowiskami biznesu, nauki i organizacji pozarządowych. Powołaliśmy niedawno w MC Grupę roboczą ds. otwartych danych, złożoną z przedstawicieli tych środowisk, która pomoże nam zrozumieć potrzeby odbiorców i będzie nas inspirować do dalszych działań.

Co jest zatem najtrudniejsze w otwieraniu danych? Na drodze szybkiego postępu stoją bariery technologiczne czy nietechnologiczne?

DM.: Nie istnieją większe przeszkody technologiczne przy otwieraniu danych. Oczywiście wdrożenie i utrzymanie nowego systemu oraz procedur służących udostępnianiu danych zawsze będzie wydatkiem dla urzędu. Trzeba jednak przyznać, że takie wydatki są konieczne i uzasadnione — czy to z punktu widzenia dobra publicznego, czy też wspomagania przedsiębiorczości.

TN.: W pierwszej chwili chciałem powiedzieć, że brak wiedzy i środków finansowych, ale jednak mentalność. Mentalność urzędników, przedsiębiorców, naukowców i końcowych użytkowników jest największą I najtrudniejszą do pokonania przeszkodą.

AH.: To prawda. Miałem szczęście posłuchać międzynarodowych doświadczeń z organizacji różnych wielkości w Brukseli przy okrągłym stole Komisji Europejskiej pochylającej się nad Dyrektywą Re-Use. Dość wyraźnie przebijało się tam uniwersalne dla wszystkich doświadczenie: bariery technologiczne czy nawet prawne są “tylko” wyzwaniami “technicznymi”. Wszystko zaczyna się od świadomości i mentalności wytwórców danych (głównie sektora publicznego) i potencjalnych konsumentów.

Jeżeli jest zrozumienie potencjału dobrego wykorzystania danych, to wszystkie pozostałe bariery dość szybko da się zaadresować — głównie dlatego, że wykorzystanie otwartych danych, to nie jest tylko temat “ideowy”. Za tym stoją prawdziwe pieniądze. I mowa tutaj o przychodach, które mogą zostać wygenerowane przez biznes i budżet państwa pośrednio przez podatki, jak i pieniądze, które budżet może oszczędzić wydając efektywniej obecne środki.

O ekspertach:

Agata Miazga

Pełnomocnik Ministra Cyfryzacji ds. Otwartości Danych oraz Dyrektor Departamentu Otwartych Danych i Rozwoju Kompetencji od lipca 2016 odpowiada w Ministerstwie Cyfryzacji za otwieranie danych publicznych. Wcześniej zajmowała się zawodowo analityką danych i współtworzyła pozarządowy serwis poświęcony otwieraniu, gromadzeniu i wizualizacji danych publicznych Mojapolis.pl.

Daniel Macyszyn

Założyciel i prezes Fundacji ePaństwo — niezależnej organizacji pozarządowej działającej na rzecz rozwoju demokracji, otwartej i przejrzystej władzy oraz zaangażowania obywatelskiego. Fundacja używa otwartych danych, aby dostarczać obywatelom wiedzę o stanie państwa i o sprawach publicznych.

Tomasz Nadolny

W swoim rodzinnym mieście, Gdańsku, przez kilka lat otwierał dane po stronie urzędu. Pełnił również funkcję pełnomocnika Prezydenta Miasta Gdańska do spraw innowacji. Dziś, prowadzi własną działalność konsultingową pod marką Openity oraz społecznie, w ramach Civic Hub, nadal popularyzuje temat otwartych danych, uznając, że jest on zbyt ważny, żeby się w niego nie angażować.

Arkadiusz Hajduk

Prezes i współzałożyciel firmy technologicznej Transparent Data, pomysłodawca platformy informacji gospodarczej Prześwietl.pl. Jako autorytet w dziedzinie open data, w 2018 roku reprezentował Polskę przy okrągłym stole Komisji Europejskiej podczas rozmów o Dyrektywie PSI. Od br. jest również członkiem Grupy roboczej ds. otwartych danych przy Ministerstwie Cyfryzacji.

--

--