# Becoming a social data scientist

When did you first have the feeling that you know what you want to do with your life?

For me it was when I first watched a video by the Swedish physician and statistician Hans Rosling almost a decade ago. His passion for using data to explore global development was infectious. Back then I decided to study quantitative political science and to learn everything I can about how we can use data to understand our world and (hopefully) make it better.

## Social Data Science

During my undergraduate and graduate degree in Konstanz and Göteborg I took every statistics and programming course that was…

# The Monty Hall Paradox revisited- the intuition behind it and a simulation in R

In the last couple of years I had many discussions about one really counter-intuitive paradox: The Monty Hall Problem. It is so counter-intuitive that some people don’t believe you — even after you show them mathematical proof.

After having the discussion once again yesterday, I decided to put the explanation I find most intuitive into a blog post and add a simulation in R that clearly shows which solution is right.

# The Monty Hall Problem

You are a participant in a game show.

The game show host presents you three doors and you have to pick one. …

# Use R and gganimate to make an animated map of European students and their year-abroad.

Last weekend 400 million people were asked to vote a new European pairlament. For this occasion I was wondering if there is a way to use data visualisation to create an emotional picture of what the EU means to me and many of my friends. I came up with this: A map that follows 1000 randomly chosen Erasmus students and their path from home university to host university in a different country.

This blogpost I structured in three parts and follows my journey that I went through to create this visualisation. 1) Find and preprocess the data. 2) Make a…

Facebook hat seit kurzer Zeit ein neues Feature: Den “Ad Library Report”. Dort werden alle auf Facebook (und den von FB betriebenen Plattformen) geschalteten Werbungen angezeigt, die sich auf Politik oder Themen von allgemeiner Bedeutung (“issues of importance”) beziehen. Das Ganze kann man durchsuchen, filtern, und sich die Meta-Daten sogar runterladen. Diese Transparenz-Kampagne soll wohl eine Antwort auf das Versagen beim Umgang mit politischer Werbung auf Facebook bei vergangenen Wahlen sein.

Zeit ein bisschen mit den Daten herumzuspielen und herauszufinden was die Daten so hergeben. Im Folgenden schaue ich mir an:

• Wie viel Geld wird ausgegeben?
• Was bedeutet überhaupt “politische…

# Simulating individual German voter shifts with a time-varying Markov Chain based on “Wählerstromanalysen”

This is the story of an idea for a simple visualisation turning into a very fascinating challenge.

# The Idea

There is this beautiful animated data visualisation where you can follow 1000 americans on what they do in a day. It might no be the most efficient way of visualising this kind of data but it sure is mesmerising and fascinating.

So I had the idea: Why not visualise voting patterns of Germans over the last 20 years in the same way. We follow 1000 points (people) that are representative of the German population and see how the voting changes flows looks like…

# Was ist evidenzbasierte Politikgestaltung?

Seitdem Donald Trump Präsident der USA ist hört man immer wieder die Forderung, dass Politik auf Evidenz basieren muss. Aber was heißt das überhaupt? Wird Politikgestaltung in Zeiten von Donald Trump irrationaler? Und ist eine Politik, die ausschließlich auf Fakten und wissenschaftlichen Ergebnissen basiert, möglich?

# Was ist evidenzbasierte Politikgestaltung?

Der Kern geht es darum, dass Entscheidungen über staatliche Programme und Politiken auf Basis von verfügbaren Forschungsergebnissen getroffen und durch experimentelle Studien und Evaluationen informiert werden — das Ziel ist die Wirksamkeit von Programmen zu untersuchen. Schließlich sollen Steuergelder nicht für Programme ausgegeben werden, die nicht funktionieren oder sogar schädlich sind. In der Politik setzte…

# Pünktlich sein in Berlin: BVG, Wahrscheinlichkeitstheorie und Monte Carlo Simulationen

Warum kommt man in Berlin andauernd zu spät, obwohl man laut Google Maps rechtzeitig das Haus verlassen hat? U-Bahn knapp verpasst, Bus kommt nicht, Polizeieinsatz an der Ringbahn, Schienenersatzverkehr. So richtig reibungslos verlaufen die wenigsten Trips mit dem öffentlichen Nahverkehr durch die Hauptstadt.

Wie plant man also eine Route durch Berlin so, dass man nicht zu spät kommt und trotzdem nicht unnötig früh das Haus verlassen muss? Sollte man lieber Bus oder U-Bahn nehmen? Und ist die Route, die Google Maps vorschlägt, immer die Beste? Bei der Beantwortung dieser Fragen können uns Wahrscheinlichkeitstheorie und Monte Carlo Simulationen helfen.

Mein täglicher…

# We need to unf*ck applied Statistics. Tschüss Signifikanztests.

SozialwissenschaftlerInnen, ÖkonomInnen, MedizinierInnen — alle kennen es: Ist mein Effekt signifikant? Ist der p-Wert unter 0.05? Stehen da drei Sterne neben dem Ergebnis? Das sind die Signifikanztests, die oft darüber entscheiden ob eine Arbeit erfolgreich oder eine Studie die Veröffentlichung wert ist.

Vor zwei Wochen haben über 800 StatistikerInnen im Nature Magazin das Ende der Signfikanztests ausgerufen. Meine Überschrift klingt drastisch, der Nature-Kommentar klingt aber entsprechend. Hier fasse ich drei Gründe zusammen, warum wir nicht mehr von „statistisch signifikant“ sprechen sollten und was die Alternativen sind.

# 1. Arbiträre Regeln

Wenn von Siginfikanztests die Rede ist, dann geht es um die Interpretation eines Nullhypothesen-Tests…

# Politische KI Strategie: Zivilgesellschaft an der Seitenlinie

Rund um das Thema künstliche Intelligenz bildet sich ein politischer Konsens: Mit den richtigen Rahmenbedingungen bieten diese Methoden der fortgeschrittenen Datenanalyse ein großes Potential für unser Wirtschaft und Gesellschaft. Aber wer gestaltet die Entwicklung und Anwendung von Künstlicher Intelligenz (KI) in Deutschland?

Zu Beginn der KI Strategie der Bundesregierung heißt es, dass ein „gemeinschaftliches Handeln von Wirtschaft, Wissenschaft, Politik und Zivilgesellschaft erforderlich“ sei. Während die KI Strategie schon aus unterschiedlichen Perspektiven kommentiert und kritisiert worden ist, vernimmt man aus dem gemeinnützigen Sektor wenig zu dem Thema. Unverständlich, denn aus zivilgesellschaftlicher Perspektive wäre bei dem Thema viel mehr zu holen.

Rollenverteilung…

# Wirken die #Fridays4Future Proteste? Eine schnelle Evaluation mit Machine Learning und Google Daten.

Drei Themen die gerade voll im Trend sind: Die Fridays4Future Streiks, Machine Learning und Wirkungsmessung. In diesem Blogpost werde ich erklären, was das alles miteinander zu tun hat. Ich werde der Frage nachgehen: Wie können wir die Wirkung der Klimastreiks messen — mithilfe von Machine Learning?

## #Fridays4Future

Doch eins nach dem anderen: Die Fridays4Future Demonstrationen spalten gerade Deutschland. Während tausende Schülerinnen und Schüler, Studierende und Wissenschaftler auf die drohende Klimakatastrophe aufmerksam machen wollen, meinen andere, dass die Jugend doch bitte wieder ein bisschen unpolitischer werden solle. Mittelfristig sollen die Proteste einen Politikwandel herbeiführen (auch wenn ein unmittelbarer Politikwechsel gefordert wird). Kurzfristig…

## Johannes Müller

Get the Medium app