Aus Daten Dinge sichtbar machen — wie geht das? II

the peak lab.
the peak lab.
Published in
5 min readOct 18, 2018

By Moritz Mönning

Eine Data Science Artikelserie

Credit: Jose Alonso, Unsplash

Unser erstes Beispiel beschäftigt sich mit dem Thema Waffenmissbrauch in den USA am Beispiel von Bandenkriminalität. Mit Hilfe von Visualisierungstechniken möchten wir aufdecken, welche Informationen und Muster sich in Polizeidaten finden lassen, die sich auf Waffenmissbrauch beziehen. Auf diese Weise wollen wir veranschaulichen, welches oft ungenutzte Potential in großen Datenmengen verborgen liegt.

Trotz über 20.000 existierender Regularien in Bezug auf Waffenbesitz, ist das Recht eine Schusswaffe zu tragen in den USA durch den zweiten Zusatzartikel aus dem Jahr 1791 verfassungsrechtlich geschützt. Darin heißt es:

“Da eine gut ausgebildete Miliz für die Sicherheit eines freien Staates erforderlich ist, darf das Recht des Volkes, Waffen zu besitzen und zu tragen, nicht beeinträchtigt werden.”

Wie hoch der Anteil an Schusswaffen in den USA tatsächlich ist, darüber gibt es keine genauen Zahlen. Eine landesweite Datenbank zur Registrierung von Waffenbesitz gibt es nicht. Verschiedene Umfragen aus dem Jahr 2016/17 besagen laut eines CNN-Artikels, dass zwischen 32 und 42 Prozent der Amerikaner in Haushalten mit Schusswaffen leben. Was jedoch sicher ist: Mit dem Recht Waffen zu besitzen, geht leider auch einher, dass es in den USA regelmäßig zu illegalem Gebrauch von Schusswaffen kommt — oft mit schwerwiegenden Folgen. Wie sich das in Zahlen ausdrücken lässt und welche Auswirkungen das hat, möchten wir im Folgenden zeigen:

Die von uns untersuchten Daten wurden im Zeitraum vom 01. Januar 2014 bis einschließlich 31. Dezember 2017 von den amerikanischen Behörden gesammelt. Unsere Analyse der 225.597 geo-annotierten Datensätze zeigt, dass die Straftaten von Jahr zu Jahr steigen. Während im Jahr 2014 51.854 Waffenmissbräuche registriert wurden, hat sich diese Zahl bis 2017 auf 61.402 erhöht. Ein Anstieg von circa 18,4 Prozent.

Credit: the peak lab.

Unabhängig von der zeitlichen Perspektive der Daten, ist es besonders für ein so großes Land wie die Vereinigten Staaten interessant, die räumlichen Unterschiede zu betrachten. Wenn man die Häufigkeit der Waffenmissbräuche anhand der einzelnen Bundesstaaten aufschlüsselt, werden deutliche Unterschiede erkennbar: Während im Westen nur in Kalifornien und im Süden in Texas Ballungszentren erkennbar sind, häufen sich die Vorfälle im gesamten Bereich östlich von Texas mit einem Spitzenwert von 17.556 Fällen in Illinois im angegebenen Zeitraum.

Credit: the peak lab.

Zusätzlich zu der Häufigkeit des illegalen Gebrauchs von Schusswaffen, liefern die untersuchten Polizeidaten Hinweise auf die Charakteristika der Vorfälle. Wir haben diese aufgeschlüsselt und herausgefunden, dass beispielsweise in der Hochburg Illinois neben den für Waffenmissbrauch „gewöhnlichen“ Merkmalen wie etwa unerlaubter Waffenbesitz und Abfeuern von Schüssen unter Drogeneinfluss, Bandenkriminalität einen großen Anteil der Missbräuche ausmacht. Diese Annahme wollen wir im Folgenden genauer betrachten.

Sortiert man alle amerikanischen Städte absteigend nach der Anzahl der Vorfälle mit Einfluss von Gangmitgliedern, so setzen sich klar drei Städte von der Masse ab. Dabei handelt es sich um Chicago in Illinois (1378 Fälle), Portland in Oregon (259 Fälle) und Fresno in Kalifornien (235 Fälle). Um die Entwicklung im Laufe der Zeit besser nachvollziehen zu können, haben wir die Fälle monatsweise aggregiert und als Zeitreihe dargestellt.

Credit: the peak lab.

Besonders auffällig ist, dass die Gangkriminalität in Chicago scheinbar je nach Jahreszeit unterschiedlich hoch ist. So ist zu den warmen Sommermonaten stets ein rapider Anstieg zu verzeichnen, während die Vorfälle zum Winter hin wieder abnehmen. Der signifikante Abstieg im Jahr 2017 wird später noch genauer unter die Lupe genommen.

Um die verschiedenen Verbrechensmerkmale der drei Städte zu veranschaulichen, haben wir die Städte relativ zueinander dargestellt. Dabei fällt auf, dass jede Stadt eine eigene Struktur aufweist. Während in Fresno und Chicago besonders oft der Waffenbesitz der Gangmitglieder geahndet wurde, macht der Drogeneinfluss ausschließlich in Fresno einen Großteil aus. Der hohe Anteil von sonstigen Merkmalen in Portland ist einer sehr hohen Anzahl an Fällen geschuldet, bei denen zwar geschossen, allerdings niemand verletzt oder getötet wurde.

Credit: the peak lab.

Bei jedem Vorfall notiert die zuständige Polizeibehörde mit prägnanten Schlagworten besondere Auffälligkeiten. Diese Notizen haben wir mit sogenannten Wordclouds visualisiert. Dabei gibt die Größe der jeweiligen Wörter die Häufigkeit der notierten Schlagworte an.

Chicago | Portland
Fresno

Chicago ist die Stadt in den USA mit der höchsten Gangkriminalität. Mit 1.378 von den insgesamt 5.395 Fällen in den vereinigten Staaten verzeichneten Vergehen, macht allein Chicago über ein Viertel aller Verbrechen in diesem Zusammenhang aus. Bezieht man das Ganze auf den Staat Illinois, so macht hier Chicago mit 82,91% den Großteil aus.

Um einmal die Entwicklung der Art der Vorfälle nachvollziehen zu können, haben wir die Verbrechensmerkmale quartalsweise ausgewertet und nachfolgend dargestellt.

Credit: the peak lab.

Die nachfolgende Animation dient dazu die Orte der einzelnen Vorfälle im Laufe der Zeit zu identifizieren. Dabei ist die Darstellung in Quartale unterteilt. Zudem werden neben den Geokoordinaten zwei weitere Attribute berücksichtigt. Während die Größe der Punkte angibt, wie viele Menschen durch den jeweiligen Vorfall verletzt oder getötet wurden, steht die Farbe für das Alter der Opfer. Eine Erläuterung der Farben sowie eine Zuordnung der Opferanzahl (X-Achse) zu der jeweiligen Altersklasse (Y-Achse), findet sich in der Legende unter von der Animation.

Chicago konnte nach einer starken Zunahme der Schießereien bis einschließlich 2016 seit 2017 einen Rückgang verzeichnen. Neben der Anstellung von hochqualifizierten Polizisten und einer starken Fokussierung auf die Themen Waffen- und Gangkriminalität, nutzt das Chicago Police Department seit kurzem auch „Predictive Crime“ Technologien. Dabei werden Taten bereits vorhergesagt bevor sie passieren. Dies geschieht anhand der Analyse von historischen Daten, aufgrund dessen vermutet wird, dass bei einer ähnlichen Parameterkombination auch in Zukunft gewisse Bereiche besonders gefährdet sind.

Daten mit ungeahnten und vor allem ungenutzten Potentialen liegen überall verborgen. Sie werden meistens einfach in einer Datenbank abgelegt und verweilen dort oft ungenutzt für eine lange Zeit. Wir möchten zeigen, dass bereits mit einfachen Analysen und dem Einsatz von Filtern neue Erkenntnisse geschaffen werden können, welche ein besseres Verständnis der Daten ermöglichen. Dank der hohen Anzahl an Datensätzen, können wir die die Analysen beliebig skalieren. So können beispielsweise gesondert voneinander verschiedene Staaten oder gar Städte auf ihre Muster hin untersucht werden. Um euch dies zu demonstrieren, hat mein Kollege Andy Meinke im dritten Teil unserer Artikelreihe die Stadt New York auf ihre Verbrechen hin untersucht und dazu interessante Einblicke erhalten. Stay tuned!

--

--

the peak lab.
the peak lab.

the peak lab. is a design driven software company based in Oldenburg, Germany. We create, design & develop innovative software, smart apps & digital products.