Relacja z konferencji The Future Is Data 2021

Przegląd najciekawszych prelekcji z II konferencji The Future is Data Przyszłość to dane o otwartych danych, której nasza firma Transparent Data była społecznym partnerem. Konferencję zorganizowała Kancelaria Prezesa Rady Ministrów 9 listopada 2021 roku.

Transparent Data
Blog Transparent Data
7 min readNov 10, 2021

--

Konferencja Future is Data 2021

II edycja konferencji “The Future Is Data Przyszłość to dane” 2021

Głównym tematem międzynarodowej konferencji Future is Data, która drugi rok z rzędu odbyła się całkowicie on-line, było nic innego jak otwarte dane, a dokładniej zarządzanie danymi i ich wymiana (nie tylko w Polsce, ale też w całej UE). Uczestnicy konferencji mieli przyjemność posłuchać wystąpień ekspertów, którzy na co dzień zajmują się cyfryzacją i otwartymi danymi w Polsce. Swoje prezentacje przedstawili też przedstawiciele Ministerstwa Rozwoju i Technologii, GUS, Komisji Europejskiej oraz reprezentanci fundacji i przedsiębiorstw, które zajmują się przetwarzaniem danych.

Oficjalny program Future is Data Przyszłość to dane 2021 znajdziecie na rządowej stronie Otwarte Dane, a my, jako partner społeczny tego wydarzenia, poniżej przedstawiamy przegląd tematów wypowiedzi, które uznaliśmy za najciekawsze:

  1. Transformacja cyfrowa na terenie Unii Europejskiej — plany Komisji Europejskiej dotyczące strategii danych dla UE
  2. Jak cyfryzować polskie rejestry handlowe i otwierać kolejne dane, żeby wychodzić naprzeciw odbiorcom danych i biznesowi
  3. Wisienką na torcie jest historia korzyści, wynikająca z wykorzystania otwartych danych i dzielenia się nimi — przykład GTM Metropolia
  4. Data Governance Act (DGA), a dokładniej, dlaczego ten akt stoi niejako w sprzeczności z RODO

Transformacja cyfrowa w UE

Tworzenie europejskiego wewnętrznego rynku danych

Konferencja Future is data Dane to przyszłość, 2021, prelekcja Christiana D’Cunha

Pierwszą prezentację podczas konferencji przedstawił przedstawiciel Komisji Europejskiej Christian D’Cunha, który przybliżył uczestnikom plany UE na rozwinięcie rynku open data w krajach członkowskich. Transformacja cyfrowa, a dokładniej przeniesienie danych do chmury, która bezpośrednio przyczyni się do utworzenia wewnętrznego rynku danych w Unii Europejskiej, według D’Cunha jest odpowiedzią na próbę połączenia potrzeb interesariuszy różnych branż.

Jakie branże nie wykorzystują potencjału danych? Doskonałym przykładem jest rolnictwo. Co roku zbieranych jest miliony danych, które można by z powodzeniem wykorzystać np. do efektywniejszego planowania upraw, ale mimo iż są one publicznie dostępne, to otwarte są w takiej formie, że małe przedsiębiorstwa rolne i pojedynczy rolnicy nie są w stanie szybko i łatwo wyciągnąć z nich odpowiednich wniosków. Nie są oni analitykami danych, a przebicie się przez kilkaset baz danych jest zbyt czasochłonne dla standardowego przedstawiciela branży. D’Cunha szacuje, że na całym świecie istnieje może tylko 8% dużych organizacji, które są w stanie przetwarzać te dane i rzeczywiście je wykorzystywać. Dane więc są i “leżą”, ale co z tego? Okazuje się, że brakuje jednostek, które “wzięłyby” te dane pod lupę i przetworzyły je w sposób, który realnie wspiera sektor. Innymi słowy, firm lub podmiotów trzecich, które z danymi dla rolników, zrobiłyby coś takiego jak my w Transparent Data robimy z danymi rejestrowymi dla polskich działów compliance.

D’Cunha zwrócił też uwagę na to, że na rynku danych otwartych na terenie Unii Europejskiej cały czas można spotkać wiele barier. Jedną z tych najpoważniejszych, z którą nowa strategia danych będzie próbowała walczyć, jest to, że większość podmiotów, które posiada dane, chce je udostępniać na swoich własnych zasadach, gdzie bez standaryzacji ciężko jest później wiązać ze sobą takie dane.

Transformacja cyfrowa ma zapewnić swobodny przepływ danych w UE i sprostać wyzwaniom eksplozji danych, dzięki zachęcaniu posiadaczy danych do altruizmu danych.

Altruizm danych, czyli dzielmy się tym, co mamy

Komisja UE zauważa, że wiele podmiotów nie ma dostępu do danych, które de facto generują ich własne produkty. Chodzi m.in. o dane, które zbierają profesjonalne firmy badawcze, gdy tworzą raporty danych branż — są to zazwyczaj dość kosztowne publikacje, a i same podmioty nie zawsze wiedzą o ich istnieniu. Zachęcenie do dzielenia się własnymi danymi (nawet z konkurencją), uczciwość gospodarowania danymi oraz usunięcie dysproporcji w dostępie — oto wyzwania, przed jakimi obecnie stoimy.

Jak cyfryzować polskie rejestry handlowe?

O otwieraniu kolejnych danych w zgodzie z oczekiwaniami klientów

Konferencja Future is data Dane to przyszłość, 2021, prelekcja Arka Hajduka

Weryfikacja kontrahenta może być — napiszmy to wprost — męczarnią dla przykładowego Kowalskiego, który musi zajrzeć średnio do 2–3 różnych rejestrów — czasami tylko po to, żeby dokonać należytej staranności w VAT. Taki proces weryfikacji jest czasochłonny, szczególnie jeśli dodamy do tego przeróżne ograniczenia, takie jak Captche, limity w ilości sprawdzeń w rejestrze, przerwy między kolejnymi wyszukaniami albo to, że pewnych informacji w ogóle nie sposób znaleźć (np. gdzie sprawdzić spółki cywilne? Nie ma o nich informacji ani w CEIDG, ani w KRS, a baza REGON udostępnia pewne dane, ale nie podaje daty zakończenia działania spółki). O takich problemach opowiadał podczas swojej prelekcji Arek Hajduk, CEO naszego data software house.

Wskazał on, że żeby wytyczyć dobry kierunek otwierania rejestrów, wystarczy (i należy) posłuchać użytkowników tych baz — obywateli i biznesu.

Jakie są oczekiwania użytkowników polskich rejestrów?

  • Chcą mieć wolny dostęp do rejestrów, kiedy tylko tego potrzebują, bez żadnych limitów na sprawdzanie i pobieranie danych. Nie chcą musieć czekać godzinę ani dobę aż znów będą mogli zajrzeć do rejestru. Jako przykład podajmy planowaną od 2022 roku zmianę w CEIDG, zgodnie z którą konsumenci API będą mogli sprawdzić tylko 1000 działalności na godzinę (dla biznesu jest to zdecydowanie za mało).
  • Chcą dostępu do aktualnych danych w czasie rzeczywistym — nie chcą dowiadywać się o zamknięciu firmy kontrahenta z kilkumiesięcznym opóźnieniem.
  • Chcą, aby te dane prezentowano im w łatwej do odczytania i zrozumienia formie. Chcą się szybko dowiedzieć czy dana firma jest stabilna finansowo i ile zarobiła, zamiast gimnastykować się ze sprawozdaniami finansowymi w XML, które łatwo odczytują tylko firmy z odpowiednim zapleczem technologicznym — dla reszty informacje w XML to ciągi znaków, które mogą przyprawić o zawrót głowy.
  • Chcą znaleźć w jednym miejscu wszystkie informacje na potrzeby oceny ryzyka biznesowego. Nie chcą się zastanawiać, w którym rejestrze znajdą prawdziwe dane — chcą mieć pewność, że ten sam numer NIP znajdą w każdym rejestrze.
  • Chcą otrzymywać informacje kompletne, na przykład dowiedzieć się, ile dana firma ma pracowników.
  • Chcą mieć dostęp do historycznych informacji — móc sprawdzić, czy kontrahenci prowadzili w przeszłości inne biznesy, które zajął komornik.

W którą stronę powinna iść cyfryzacja rejestrów, żeby było lepiej, a nie gorzej?

Konferencja Future is data Dane to przyszłość, 2021, prelekcja Arka Hajduka

Arek Hajduk podkreślił, że polskie organy państwowe wcale nie muszą “wymyślać koła na nowo”. Jeśli spojrzeć na dobre praktyki z zagranicy, można po prostu produkować proste i szybkie aplikacje, które będą pokazywać powiązane informacje z różnych rejestrów, i:

  • Obywatelom oddawać je do użytku za darmo,
  • Biznesowi je sprzedawać,
  • Rozwijać je w kierunku wskazanym przez klienta płacącego.

Innymi słowy, trzeba otwierać, otwierać i otwierać, udostępniać za pomocą szybkich API, a także wspomagać twórców aplikacji, które te dane rejestrowe przetwarzają, bo ich produkty mogą stać się kołem napędzającym polską gospodarkę.

Historia korzyści, wynikająca z wykorzystania otwartych danych i dzielenia się nimi

Dane samorządów dla obywateli, a nie tylko samych samorządów — przykład GZM Metropolia

Konferencja Future is data Dane to przyszłość, 2021, prelekcja Pawła Krzyżaka i Huberta Morawskiego

W jaki sposób można wykorzystać dane, których właścicielem są samorządy, tak aby poprawić jakość życia mieszkańców danych regionów? Pokazanym na Future is Data 2021 przykładem jest aplikacja GZM Metropolia o nazwie M2GOinfo. Jak opowiadali Paweł Krzyżak i Hubert Morawski nowa app’ka umożliwia sprawdzenie lokalizacji wszystkich przystanków tramwajowych oraz rzeczywisty czas oczekiwania na tramwaje i autobusy (czyli pokazuje dane transportowe real-time). Co więcej, użytkownicy mogą personalizować sobie dostęp do informacji o połączeniach, z których korzystają najczęściej. Jest to więc nowa jakość w porównaniu z popularnymi wyszukiwarkami połączeń przechowującymi dane z oficjalnych rozkładów, które jak powszechnie wiadomo, często nie są zgodne z realiami.

Warto przy tym zaznaczyć, że M2GOinfo to tylko ułamek tego, nad czym pracuje aktualnie Górnośląsko-Zagłębiowska Metropolia. Jednostka mocno inwestuje w rozbudowę repozytorium otwartych danych samorządowych — już w tej chwili znaleźć w nim można setki otwartych zbiorów danych o budżetach poszczególnych gmin, edukacji, ekologii, kulturze i między innymi planach przestrzennych.

Data Governance Act (DGA) vs RODO

Dyskusja nad mechanizmem przekazywania danych osobowych

Konferencja Future is data Dane to przyszłość, 2021, panel Data Governance Act

Podczas konferencji Future is data Przyszłość to dane 2021 zorganizowano również panel dyskusyjny Data Governance Act — nowe modele wymiany danych. Udział w nim brali Sille Sepp (MyData), Anna Lytra (Europejska Rada Ochrony Danych) oraz Mirosław Gumularz (Gumularz Kozik Kancelaria). Data Governance Act lub inaczej DGA, to nowy akt UE, nad którym prace mają zostać zakończone w grudniu 2021 roku. Jego zadaniem jest podniesienie bezpieczeństwa przetwarzania danych i zwiększenie ogólnego zaufania rynku do tego procesu.

Paneliści zwrócili uwagę na istotne nieścisłości w akcie, które konieczne muszą zostać wyjaśnione, jeśli DGA ma przynieść wymierne korzyści dla gospodarek danych na terenie UE.

Aktualnym problemem jest to, że w DGA nadal brakuje jasnego określenia odpowiedzialności za przekazywane dane. Na tę chwilę DGA stoi niejako w sprzeczności z RODO, w którym jasno określone jest, że odpowiedzialność za dane osobowe spoczywa po stronie administratora danych. W DGA brakuje wyjaśnienia, kto ponosi odpowiedzialność za zarządzanie danymi, nie ma definicji, kto jest administratorem danych, a kto procesorem i czy to on powinien ponosić odpowiedzialność za nieodpowiednie wykorzystanie tych danych przez podmioty trzecie. Bez doprecyzowania tych kwestii, DGA stworzy duże pole do ewentualnych nadużyć i sprawi, że potencjalni usługodawcy mogą rezygnować całkowicie z pośrednictwa w udostępnianiu taki danych, bo nie będą w stanie sprostać wymaganiom regulacji.

--

--