Můj první datový hackathon

Po intenzivní Digitální akademii nastalo v mém životě jakési prázdno. I když se snažím vzdělávat doma, není to totéž jako sdílet nadšení z pokroků s ostatními. Když pražská skupina Pyladies oznámila konání datového hackathonu pro začátečníky, zapudila jsem strach z neznámého prostředí a okamžitě se přihlásila.

Python + data z Sreality = zábava na celý den

Jako zadání jsme dostali k dispozici data z Sreality.cz, přesněji se jednalo o inzeráty na nemovitosti za leden 2017 a leden 2018.

Jak velký byt se vám v Praze vyplatí rekonstruovat?

Práce s textem

Přidala jsem se do týmu k Františkovi, kterého zajímalo, jak velký byt by se vám v Praze vyplatil rekonstruovat a prodat. Ačkoliv tento parametr je součástí inzerátu, z našeho datasetu jsme informaci mohli získat pouze popisků inzerátu. Jenže ono to s tou češtinou není tak jednoduché…

Ukázka jednoho z popisků
Co když má celý dům rekonstrukci fasády, ale samotný byt rekonstrukci nemá? Byl to oříšek!

Výsledky přinesly další iterace

První grafy nedávaly úplně smysl. Proto jsme se rozhodli, že budeme pracovat pouze s inzeráty, u kterých bezpečně víme, že rekonstrukce proběhla nebo neproběhla. Pokud o ní není ani zmínka, pryč s nimi!

Porovnání rozdílu ceny za m2 u bytů bez rekonstrukce (modrý sloupec) a s rekonstrukcí (oranžový sloupec) za rok 2018. Díváme se pouze na ceny bytů, které jsou na prodej.
Cena za m2 u bytů podle dispozice za 2017 v Praze. Modrý sloupec je cena před rekonstrukcí a oranžový po rekonstrukci.
Cena za m2 u bytů podle dispozice za 2018 v Praze. Modrý sloupec je cena před rekonstrukcí a oranžový po rekonstrukci.
Tady vidíme srovnání za oba roky.
  • Jiný tým kombinoval data s údaji o zastávkách metra v Praze a díval se, jak pořídit nejlevnější byt co nejblíže zastávce metra. Neméně zajímavá byla i jejich analýza nad tím, které zastávky mají ve svém okolí nejdražší nebo naopak nejlevnější byty.
  • S podobnými údaji pracoval i třetí tým. Ten vytvořil prototyp aplikace, do které jste zadali svoji polohu v souřadnicích a čas, který jste ochotní dojít pěšky na nejbližší zastávku metra. Výsledkem byl výběr inzerátů, které odpovídají zadaným kritériím.

A co mi to dalo?

Moji největší bariérou byl strach. Obava, že nebudu tak dobrá jako ostatní, že datové knihovny Pythonu nemám moc zažité a že tam budu úplně mimo. Nakonec jsem zjistila, že to bylo úplně zbytečné.

Radost! Nikoliv z vítězství, ale ze zážitku a nových znalostí.

Data Specialist at Kentico and always happy to learn new stuff!

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store