BR AI + Automation Lab

Hackathon zu Structured Journalism

Wie wir mit Hilfe von KI regionalen Inhalt anbieten wollen

Cecile Schneider
BR Next

--

Beim BBC #Newshack hat das BR AI + Automation Lab den Prototyp “Remix Regional” entwickelt. Dabei geht es darum, Regionalnachrichten aus dem Radio ortsbezogen und personalisiert per App anzubieten. Die Idee folgt dem Prinzip des Structured Journalism. Und der personalisierte News-Mix hat übrigens ganz schön viel mit Lego zu tun.

App-Ansicht des Remix-Regional-Prototyps
Beim BBC #Newshack entwickelte das BR AI + Automation Lab einen Prototyp, um Regionalnachrichten aus dem Radio ortsbezogen per App anzubieten. Die Idee folgt dem Prinzip des Structured Journalism.

Der BR ist ein regionaler Anbieter. Die Vielfalt der bayerischen Regionen zeigt sich in unserem Programm, welches häufig vor Ort in den Regionalstudios oder von unseren Korrespondenten an vielen Orten in Bayern produziert wird. Deshalb war für uns im AI + Automation Lab früh klar, dass die Regionalisierung von Inhalten ein Schwerpunkt unserer Arbeit sein wird.

Hacken mit der BBC

Die BBC hatte am 3. und 4. Dezember zum BBC #Newshack “Modular Content” eingeladen. Als Leitfrage stand “How might we use modular content to personalise news experiences?” über dem Hackathon: Wie können wir modulare Inhalte nutzen, um die Nachrichten-Erfahrung zu personalisieren?

Der BBC #Newshack, organisiert vom BBC Connected Studio, war für unser Team der erste reine Remote-Hack. (v.l.n.r. Cécile Schneider, Sebastian Bayerl, Uli Köppen, Morteza Shahrezaye, Christina Elmer (Der Spiegel), Michael Kreil, Rebecca Ciesielski, Steffen Kühne)

Damit folgt der Hackathon dem Prinzip des Structured Journalism. Structured Journalism ist eine von Metadaten und neuen Technologien getriebene Richtung des Journalismus. Sie geht davon aus, dass jeder Beitrag im Kern aus einzelnen Informationsblöcken besteht. Journalist:innen können diese Blöcke dann mit Hilfe von künstlicher Intelligenz (KI) und Automatisierung zu neuen Stücken, Formaten oder sogar neuen Produkten wieder zusammenfügen.

Eine der größten Herausforderungen ist es, Inhalte von Anfang an modular zu produzieren oder bestehende Inhalte automatisiert in kleinere Informationsblöcke aufzuteilen und dabei möglichst gute Informationen über den Inhalt der einzelnen Blöcke als maschinenlesbare Metadaten zu speichern. Hierbei kommen häufig Sprachverarbeitungsverfahren (NLP) oder künstliche Intelligenz zum Einsatz.

Wie Lego-Steine unterschiedlicher Farben lassen sich korrekt gelabelte Inhalte zu immer neuen Angeboten zusammenstecken. Foto: Bonneval Sebastien on Unsplash

Das Lego-Prinzip im Journalismus

Anhand der Metadaten lassen sich die Informationsblöcke wie Lego-Steine immer wieder neu zusammenstecken, zum Beispiel zur Bildung von Zeitreihen, zur Gruppierung von Inhalten zu einem bestimmten Thema oder auch zur Fokussierung auf einen bestimmten Ort. Für den BBC #Newshack haben wir uns entschieden, die regionale Datendimension in den Blick zu nehmen.

Inhaltlich fiel unsere Wahl dabei auf die Regionalnachrichten im Vormittagsprogramm von Bayern 1, die in den Regionalstudios produziert und in fünf Regionalfenstern für Oberbayern, Niederbayern/Oberpfalz, Schwaben, Franken und Mainfranken ausgestrahlt werden.

App-Ansicht des Remix-Regional-Prototyps
Der Prototyp unseres Hackathon-Experiments “Remix Regional” steht unter dem folgenden Link als Webversion zum Ausprobieren bereit. Er funktioniert aktuell für einen Tag im November und Orte in Oberbayern, Niederbayern/Oberpfalz und den Bezirk Schwaben in Bayern.

“Remix Regional”: Personalisierte Regionalnachrichten

Unseren Prototyp “Remix Regional” für den BBC-#Newshack haben wir in weniger als 48 Stunden entwickelt. Die als App konzipierte Lösung ermöglicht es Nutzer:innen, einen Ort in Bayern auszuwählen und personalisierte Regionalnachrichten aus dem Programm des Bayerischen Rundfunks anzuhören. So erhalten Nutzer:innen in Landsberg am Lech nicht nur Nachrichtenclips aus Oberbayern, wie es im Radioprogramm der Fall wäre, sondern beispielsweise auch aus Memmingen im benachbarten Regierungsbezirk Schwaben.

Dafür sorgt im Hintergrund der App ein Algorithmus, der nach Faktoren wie Distanz, Ortsgröße und räumlicher Granularität das Nachrichtenpaket zusammenstellt. Die Reihenfolge der ausgewählten Clips legt dann ein Vektor-Algorithmus fest, der die Meldungen nach ihrer thematischen Ähnlichkeit clustert. So können wir für die Nutzer:innen nicht nachvollziehbare Themensprünge vermeiden, wie von Corona zu Sport zurück zu Corona.

Nichts geht ohne Metadaten

“Remix Regional” zeigt damit eine Idee, wie wir modulare Inhalte aus dem linearen Radioprogramm personalisiert in einer App ausspielen können. Eine andere Umsetzung mit Inhalten entlang einer Reisestrecke zeigt der ebenfalls hier im Blog vorgestellte Prototyp Drive by Bayern.

Möglich sind solche Herangehensweisen nur, wenn die zugrundeliegenden Inhalte - bei uns die einzelnen Meldungen der Regionalnachrichten - in einer bestimmten Form mit passenden Metadaten vorliegen. Aus diesem Grund haben wir uns bereits im Vorfeld des Hackathons an die Archive des BR gewandt, um passendes Rohmaterial für unsere Idee zu erhalten.

Dateninfrastruktur für Structured Journalism

Unsere Archivkolleg:innen beschafften uns die Regionalnachrichten aus Schwaben, Oberbayern und Niederbayern/Oberpfalz, schnitten sie in einzelne Clips pro Meldung und gaben uns pro Clip umfangreiche, teils von Hand erstellte Metadaten mit, die u.a. Orte, Regionen, Themen und automatisiert mit Audiomining erstellte Transkripte enthielten. So hatten unsere Algorithmen ausreichend Datenpunkte, um die Clips nach unseren Kriterien neu zu arrangieren. Das folgende Beispiel zeigt einen kleinen Ausschnitt unserer Metadaten.

NUMBER: 82940CLASS: “News”TITLE: “Der Münchner Großmarkt”LANGUAGE: “de”RESSORT: “Regionalreda. Oberbayern”PROGRAM: “Bayern 1”BROADCASTDATE: “2020–11–27”BROADCASTTIME: “10:02:17”AUTHOR: “Hülsmann, Lenja”EDITOR: “go / Leidl, Barbara”SOURCE: “BR München”CHANGEUSER: “GOSSP”CHANGEDATE: “2020–11–29”CHANGETIME: “09:12:48”

Natürlich stand uns für den Prototyp nur ein Ausschnitt der Regionalnachrichten vom 25. November zur Verfügung. Die Anwendung verdeutlicht aber, wie wichtig gut strukturierte Tags und Metadaten sind, um Inhalte in anderen Kontexten zu verwenden oder personalisiert auszuspielen.

Dies ist eine technische und organisatorische Herausforderung, die Medienhäuser nur als Ganzes im Zusammenspiel von Redaktionen, Technik und Archiven lösen können. Die Aussicht auf einen neuen, strukturierten und nutzerfreundlichen Zugang zu bereits produziertem Material von hoher Qualität lässt das Unterfangen lohnenswert erscheinen. Perspektivisch kann auch die Erstellung der Metadaten teilweise oder komplett automatisiert werden.

Ein anderer Zugang zum Thema Structured Journalism mit Bezug auf Regionalisierung bietet sich durch Datenbestände, die bereits regional strukturiert vorliegen. Mit solchen Daten zu Themen wie Wetter oder Verkehr lassen sich regionalisierte Inhalte auch hervorragend mit tagesaktuellen Informationen ergänzen.

Regionale Daten für Voice

Im AI + Automation Lab haben wir seit Anfang des Jahres mit solchen Daten experimentiert. Zwei unserer Projekte bauen auf solchen Datenbeständen auf, nutzen sie aber auf sehr unterschiedliche Art. Anfang September 2020 haben wir unsere Voice-Anwendung Biowetter für Alexa [Update: Der Biowetter-Skill wurde im Juni 2024 deaktiviert] veröffentlicht. Damit können Nutzer:innen einfach per Sprachbefehl das Biowetter für alle Orte in Deutschland abfragen. Biowetter gibt dann in Alexas Stimme die Einflüsse für den gewählten Ort aus.

Bild: BR/Herbert Ebner/Cécile Schneider

Der Skill setzt auf frei nutzbare Biowetter-Vorhersagen des Deutschen Wetterdienstes (DWD) auf. Die Daten liegen für elf deutsche Gebiete vor, die sich nach topographischen Gegebenheiten richten. Wir finden diese Art von Daten interessant, weil sich damit täglich neu ortsbezogene Angebote für Nutzer:innen machen lassen.

Bei BR24 gibt es ein umfangreiches Angebot an automatisiert erstellten Grafiken, Texten und Karten zur Corona-Pandemie. Auch dafür nutzen wir regional strukturierte Daten, zum Beispiel für die Landkreiskarte zur 7-Tage-Inzidenz in Bayern.

Mit Hilfe automatisierter Datenpipelines werden Corona-Infektionszahlen vom Robert Koch-Institut und dem Landesgesundheitsamt in tagesaktuelle Karten und Grafiken übersetzt. Grafik: BR

Sind diese datenbasierten regionalen Inhalte erst einmal erstellt, können wir sie mit KI und Automatisierung nach dem Prinzip des Structured Journalism ebenfalls in ganz unterschiedlichen Kontexten nutzen — zum Beispiel als individuellen Zusatz für eine Nachrichtenanwendung wie den “Remix Regional”-Prototyp, über Smart Speaker und vieles mehr.

Inhalte aus dem linearen Programm

Unser “Remix Regional”-Prototyp vom BBC Newshack, der Voice-Skill Biowetter und die Corona-Zahlen für Bayern und Deutschland sind drei Projekte aus dem AI + Automation Lab, die regionale Daten und Inhalte in ganz unterschiedlichen Kontexten nutzbar machen. Teils sind dies Inhalte aus dem linearen Programm, die auch in nicht-linearen, personalisierten Anwendungen genutzt werden können, teils relevante Daten zum Geschehen vor Ort.

Die Erfahrungen, die wir so mit regionalisierten Anwendungen und dem örtlichen Bezug von Informationen gewinnen konnten, bilden eine wichtige Grundlage für zukünftige Projekte im BR und helfen uns, die Bedürfnisse unserer Nutzer:innen und im Haus besser zu verstehen. Gleichzeitig können wir Feedback in die Strategie zurückgeben, um zum Beispiel technische Infrastruktur zukunftsweisend zu gestalten.

Der Prototyp unseres Hackathon-Experiments “Remix Regional” steht unter dem folgenden Link als Webversion zum Ausprobieren bereit.

Hackathon-Team: Sebastian Bayerl, Michael Kreil, Morteza Shahrezaye, Uli Köppen, Cécile Schneider, Rebecca Ciesielski, Steffen Kühne (alle BR AI + Automation Lab), Christina Elmer (Der Spiegel)

--

--