Aus Daten Wissen generieren — wie geht das? I

the peak lab.
the peak lab.
Published in
2 min readOct 9, 2018

By Jens Läkamp

Eine Data Science Artikelserie

Einleitung: Irgendwas mit Daten

Begriffe wie Big Data oder Data Science sind in aller Munde. Doch was verbirgt sich eigentlich dahinter? Wie funktionieren das Auffinden und Lesen sowie die Deutung von Daten? Welchen wissenschaftlichen, wirtschaftlichen, gesellschaftlichen oder gar politischen Nutzen hat die Datenwissenschaft? Und warum beschäftigt sich ein Unternehmen wie the peak lab. damit?

Diese Fragen haben wir unseren beiden Data Scientisten Andy und Moritz gestellt. Seit zwei Jahren arbeiten sie intensiv daran, unsere the peak lab. Data Science Unit aufzubauen. In Kooperation mit der Universität Oldenburg haben wir in diesem Zusammenhang unter anderem die Projektgruppe www.empowergenerations.de ins Leben gerufen. Gemeinsam mit Kolleginnen und Kollegen unseres Teams entwickeln Studierende mit Hilfe von Data Science und Blockchain Ideen für den Strommarkt, damit Menschen beispielsweise in Zukunft überschüssige Energie selbst handeln können, ohne auf Energieversorger als Zwischenhändler angewiesen zu sein. Eine Idee, die allen Beteiligten viel Geld sparen würde.

Wie so oft jedoch, wenn Experten zu Ihrem Feld befragt werden, fallen die Antworten für Laien nicht immer verständlich aus. Daher haben Andy und Moritz zwei Beispiele herausgesucht, anhand derer sie den Nutzen der Datenwissenschaften verständlich erklären möchten. Die Grundlage ihrer Untersuchung bilden Daten aus öffentlich zugänglichen Polizeidatenbanken der USA. Diese haben sie gesichtet und im Anschluss Daten in Bezug auf Waffenmissbrauch sowie Verbrechen in New York City untersucht. Die Ergebnisse sollen veranschaulichen, welchen Zweck die Analyse großer Datenmengen hat und welche Schlüsse aus Big Data gezogen werden können.

Als interdisziplinäres Wissenschaftsfeld aus Mathematik, Statistik und Informatik, verfügt Data-Science über verschiedene Methoden aus Daten Wissen zu generieren. In unserer Data Science Artikelserie möchten wir anhand von Beispielen zwei Merkmale des Wissenschaftsfelds vorstellen: Zum einen das Generieren von Wissen anhand von Visualisierungen. Ein Prozess, der aus dem so genannten Data Mining entstanden ist. Zum anderen, das Data Mining selbst, wobei versucht wird, Auffälligkeiten in Daten aufzudecken.

Unter Data Mining versteht man in diesem Zusammenhang die systematische Anwendung von statistischen Methoden auf große Mengen von Daten, mit dem Ziel, Verbindungen und Trends zu erkennen. Diese Anwendungen sind aufgrund der großen Datenmengen computergestützt.

Wenn ihr wissen wollt, welches oft ungenutzte Potential in großen Datenmengen verborgen liegt, seid gespannt auf unseren nächsten Artikel. Im zweiten Teil erklärt Moritz euch am Beispiel des illegalen Gebrauchs von Schusswaffen in den USA, wie dank der richtigen Analyse von Daten Informationen sichtbar gemacht werden können.

--

--

the peak lab.
the peak lab.

the peak lab. is a design driven software company based in Oldenburg, Germany. We create, design & develop innovative software, smart apps & digital products.