Daten-Journalismus

Satelliten-Daten als investigatives Recherchetool

Diese Chancen bieten Daten von NASA, ESA und Co. für den Journalismus

Rebecca Ciesielski
BR Next

--

Wo ist die Hitzebelastung in deutschen Städten am größten? Das haben wir, Datenjournalist:innen vom BR AI + Automation Lab und von BR Data, mit Hilfe von Satellitenbildern analysiert. Unser Longread „In der Hitze der Stadt“ zeigt, wie Journalist:innen offene Daten von Weltraumagenturen für interaktive und investigative Geschichten nutzen können — und wo die Fallstricke liegen.

Photo by NASA on Unsplash

Der Begriff „Satellite Journalism“, Journalismus mit Satellitendaten, geistert seit einiger Zeit durch Recherche-Blogs und Twitter-Feeds. Die Verheißungen für Journalist:innen sind vielversprechend:

Die Möglichkeiten für Fact-Checking, investigative Recherchen, Umwelt-, Auslands- und Konfliktberichterstattung scheinen endlos, weil Journalist:innen mit Hilfe von Bildern aus dem Weltall direkt vom Büro-Schreibtisch aus die Vogelperspektive einnehmen und sich an jedem Ort der Welt einen Überblick verschaffen können.

Und noch mehr: Satelliten „sehen“ nicht nur entfernte Orte, sondern auch Eigenschaften von Objekten, die dem menschlichen Auge verborgen bleiben.

So die Theorie — und die Idee, mit der wir in unsere Recherche gestartet sind.

Aus dem All wird sichtbar, wo sich Deutschland aufheizt

Für den interaktiven Longread „In der Hitze der Stadt“ haben wir Satelliten-Infrarotbilder ausgewertet und visualisiert. Sie zeigen, wie stark sich Städte, Gewerbegebiete, Flughäfen, Bahnschienen oder Bergbaugebiete tagsüber aufheizen. Und wie sich die Hitze in der Nacht in eng bebauten Stadtteilen staut und dort zur Gesundheitsgefahr wird.

Die Wärmebilder machen sichtbar, in welchen Teilen deutscher Städte das Hitzerisiko am größten ist und welche einen Coolness-Vorteil haben: Beton, Asphalt, Metall und Glasfassaden sind städtische Wärmespeicher, wohingegen Bäume, Parks, Grünflächen und Gewässer kühlend wirken.

Satelliten-Aufnahmen der Wärmestrahlung zeigen, dass der Englische Garten in München an heißen Tagen deutlich kühler ist als die umliegenden Stadtteile (NASA/BR)

OSINT oder kommerziell? Die Wahl der passenden Daten

Die Verwendung von Satellitendaten für journalistische Analysen ist chancenreich, aber nischig. Das wurde uns klar, als wir uns einen Überblick über Recherchen verschafft hatten, bei denen Satellitenbilder eine wichtige Rolle spielen.

Lohnenswerte Inspiration liefern z. B. die OSINT-Recherchen von Bellingcat, eine Auswertung von illegalem Bernstein-Abbau in der Ukraine und eine Visualisierung von Bäumen und Grünflächen der Berliner Morgenpost für ganz Deutschland.

Warum sich bislang nur eine überschaubare Anzahl von Journalist:innen an Satelliten-Daten herangewagt hat, könnte zumindest teilweise an der schieren Anzahl unterschiedlicher Missionen und Systeme liegen. Aber nicht nur der Wust an Möglichkeiten stellte uns vor eine Herausforderung.

Hier sind die acht wichtigsten Dinge, die wir über die journalistische Arbeit mit Satellitendaten gelernt haben:

1. Es gibt nicht die Satellitendaten für Recherchen

Momentan kreisen über 500 Erdbeobachtungssatelliten um die Erde. Viele davon beliefern Geheimdienste oder Armeen aber auch immer mehr kommerzielle Anbieter wie Maxar, Planet oder Airbus Intelligence etablieren sich am Markt.

Manche ihrer Aufnahmen sind so genau, dass sich darauf ein aufgestellter Wäscheständer auf einem Balkon erkennen lässt. Doch die Bilder dieser Missionen kosten in der Regel viel Geld und entstehen nicht regelmäßig, sondern nur, wenn Kundschaft die Firmen mit der Beobachtung eines bestimmten Gebiets beauftragt.

Für alle mit eingeschränktem Budget oder dem Interesse, sich größere Bereiche anzusehen oder ältere Aufnahmen für Vergleiche und Zeitraffer auszuwerten, kann diese Einschränkung ein Problem darstellen.

Die kommerziellen Anbieter lassen eine Lücke, die die großen Weltraumagenturen mit ihren Open-Data-Programmen schließen. Neben der Europäische Weltraumagentur ESA und der US-amerikanischen NASA stellt beispielsweise auch die japanische JAXA die Daten der eigenen Missionen frei zur Verfügung.

Mit welcher Regelmäßigkeit was genau erfasst wird, unterscheidet sich zum Teil sehr. Deshalb gibt es ein paar Fernerkundungs-Basics, die hilfreich sind, um zu verstehen, welche Geschichten sich mit welchen Daten erzählen lassen.

2. Man sollte es ernst meinen

Und sich zumindest etwas mit den physikalischen Zusammenhängen beschäftigen, die dafür verantwortlich sind, dass Satelliten die Dinge ziemlich anders sehen als wir.

Die Sensoren der meisten Erdbeobachtungssatelliten erfassen nicht nur die für uns sichtbaren Anteile des Lichts (Rot, Grün und Blau), sondern auch andere Wellenlängenbereiche des sogenannten elektromagnetischen Spektrums:

Radiowellen, Mikrowellen, sichtbares Licht: Sie alle haben unterschiedliche Wellenlängen und Eigenschaften und sind Teil des elektromagnetischen Spektrums (NASA)

Elektromagnetische Energie-Wellen unterscheiden sich stark. Manche Radio-Wellenlängen sind größer als Gebäude, Gamma-Strahlung hingegen winzig klein.

Der für Menschen sichtbare Anteil der elektromagnetischen Energie ist erstaunlich gering, alle für uns sichtbaren Farben liegen im Bereich von ungefähr 400 und 780 Nanometern.

Im Gegensatz zu Satelliten sehen wir also weder Infrarot-Licht noch die deutlich längeren Mikrowellen, wobei beides ungemein praktisch wäre — und zwar deshalb:

In den Bereichen des elektromagnetischen Spektrums, die für Menschen unsichtbar sind, unterschieden sich Wasser, Böden und Vegetation stark voneinander. Für automatische Analysen ist das praktisch. (Rainer Reuter, seos-project.eu)

Menschen nehmen Blätter und Pflanzen als grün wahr, weil das Blatt-Chlorophyll das Sonnenlicht in einem Wellenlängenbereich von rund 0,5 μm stärker reflektiert als in den Bereichen für rot und blau.

Satelliten-Sensoren erfassen im Gegensatz zu uns außerdem das sogenannte nahe Infrarot (near-infrared, NIR). In diesem Bereich reflektiert gesunde Vegetation besonders stark.

Für Satelliten strahlen Pflanzen also leuchtend infrarot, wohingegen Wasser die meiste Energie schluckt und viele Böden in ganz verschiedenen, längeren Wellenlängenbereichen stark reflektieren.

Hat ein Satellit für eine bestimmte Koordinate die Werte für Grün und NIR gemessen, kann man ganz gut sagen, ob sich auf diesem Punkt der Erdoberfläche Vegetation befindet oder nicht.

Aber nicht alles, was Satelliten messen, sind Reflexionen des Sonnenlichts. Für unsere Recherche haben wir das thermische Infrarot (thermal infrared, TIR) genutzt, welches die Erdoberfläche auch bei nächtlicher Dunkelheit emittiert.

Es ist keine Raketenwissenschaft, oder doch?

Nicht alle Satelliten messen die Oberflächentemperatur der Erde. Für unsere Analyse standen drei Missionen zur Auswahl: Sentinel-3 des europäischen Copernicus-Programms der ESA sowie die NASA-Missionen Landsat und ECOSTRESS.

Wobei es sich bei Letzterem um einen Sensor handelt, der sich auf der Internationalen Raumstation ISS befindet. Um einschätzen zu können, welche Datenquellen zum eigenen Vorhaben passen, sollte man die drei Haupt-Unterscheidungskriterien für diese Art der Satellitendaten kennen.

3. Wichtig sind Wellenlänge, Pixelgröße und Zeit

Die sogenannte spektrale Auflösung (spectral resolution) beschreibt, wie viele unterschiedliche Wellenlängenbereiche die Sensoren einer Satelliten-Mission einzeln erfassen können.

Je höher der Wert, umso mehr unterschiedliche Eigenschaften von Objekten lassen sich unterscheiden. Landsat 8 verarbeitet neben Rot, Grün, Blau und der Wärmestrahlung noch sechs weitere Wellenlängenbereiche.

Andere Satellitensensoren erfassen noch viel mehr. Das Instrument MODIS, das sich auf den beiden NASA-Satelliten Terra und Aqua befindet, misst beispielsweise 36 unterschiedliche Bereiche des elektromagnetischen Spektrums.

Die sogenannte räumliche Auflösung (spatial resolution) bezeichnet den Teil der Erdoberfläche, die durch einen einzelnen Pixel dargestellt wird. Ist der Bereich besonders groß, sieht man nur wenige Details, ist der Bereich sehr klein, erkennt man auf den Bildern auch kleinere Objekte wie einzelne Autos oder Bäume.

Das kennt man nicht nur von Satellitenbildern, sondern von allen Fotos, in die man auch bei nur guter Auflösung weit reinzoomen kann, um kleine Details zu erkennen.

Orthofotos der Stadt München mit verschiedenen Auflösungen: Links 100m, Mitte 30m, rechts 1m (DL-DE-BY-2.0 Bayerischen Vermessungsverwaltung)

Im Gegensatz zu manchen kommerziellen Daten mit einer Auflösung von zum Teil weniger als 30 Zentimetern pro Pixel, sind die frei verfügbaren Daten staatlicher Missionen oft deutlich schlechter aufgelöst.

Ein Pixel eines Landsat-8-Wärmebilds hat eine Kantenlänge von rund 100 Metern, während ein einziges Pixel von Sentinel-3 einen ganzen Quadratkilometer der Erdoberfläche abbildet.

Unser Ziel war es, das Hitzerisiko in deutschen Städten möglichst konkret für einzelne Stadtteile darzustellen. Deshalb haben wir uns für Landsat 8 entschieden und nicht für die deutlich gröberen Daten von Sentinel-3.

Auch die Zeit (temporal resolution) ist für die Satellitenwahl ein entscheidender Faktor. Die meisten Erdbeobachtungssatelliten umkreisen den Globus von „oben“ nach „unten“, also von Pol zu Pol.

Da sie sich so mit jedem Überflug die Erdoberfläche streifenweise zusammenbasteln, liegen zwischen zwei Aufnahmen desselben Gebiets oft mehrere Tage. Im Fall von Landsat 8 liegen zwischen den Überflügen ungefähr zwei Wochen.

Bei jedem Scanvorgang erfasst ECOSTRESS einen neuen Datenstreifen. (NASA/BR)

Wolken, Datenlücken und Korrelationen

Die Wahl der passenden Daten erwies sich als relativ kompliziert. Satelliten, die die Wärmestrahlung der Erdoberfläche erfassen, dienen in erster Linie der Forschung.

Weil solche Satelliten ziemlich teuer sind, befindet sich nur eine begrenzte Anzahl von ihnen im All. Im Bereich der Wärmestrahlung ist die Datenlage nicht nur dünn, sondern auch zeitlich schlecht getaktet.

Das liegt bei Satelliten wie Landsat 8 daran, dass diese mit großer Regelmäßigkeit um den Globus kreisen: Landsat 8 scannt im Zwei-Wochen-Rhythmus und immer gegen 12 Uhr mittags alle Teile Deutschlands und liefert somit keine Nachtaufnahmen.

4. Die Daten müssen zur Geschichte passen

Für die Darstellung des Hitzerisikos in deutschen Städten benötigten wir allerdings auch Daten, die zeigen, wie sich in der Nacht in den Städten Wärmeinseln bilden. Denn am späten Abend und in der Nacht werden hohe Temperaturen zur Gesundheitsgefahr, weil sie die Regeneration des Körpers im Schlaf behindern.

Das nächtliche Daten-Problem hat auch die NASA erkannt und 2018 die Sensoren der ECOSTRESS-Mission ins All geschossen und an der Außenseite der ISS angebracht.

Von dort liefert das System Nachtaufnahmen von Deutschland. Diese Daten haben wir verwendet, um die nächtliche Hitzebelastung in Berlin, Frankfurt, Hannover, Köln und fünf weiteren deutschen Städten zu zeigen.

Eine ECOSTRESS-Nachtaufnahme von München. Das Umland kühlt nachts stark ab, während die Hitze in der Stadt nur langsam abnimmt. (NASA/BR)

Doch leider konnten wir hierfür nicht jede Aufnahme nutzen, die in den Sommern der vergangenen Jahre entstanden ist.

5. Wolken sind der Feind

Warum zu viele Wolken Satellitendaten unbrauchbar machen, verstehen alle, die schon einmal versucht haben, in einer bewölkten Nacht den Sternenhimmel zu sehen.

Nicht nur das für uns sichtbare Licht wird von Wasserdampf und Atmosphären-Partikeln geschluckt, auch Wärmestrahlung kann eine dichte Wolkendecke nicht durchdringen. Aufnahmen mit einer Bewölkung über 25 Prozent flogen daher aus unserem Datensatz.

Außerdem filterten wir die Aufnahmen danach, ob sie in einer Hitzewelle liegen. Um das herauszufinden, nutzten wir die Daten des Deutschen Wetterdienstes (DWD).

Der DWD betreibt in ganz Deutschland Messstationen. Im Gegensatz zu den Satellitensensoren messen die Stationen die Temperatur nicht flächig, sondern nur punktuell. Die DWD-Daten ermöglichten uns festzustellen, wann eine bestimmte Region Deutschlands in den vergangenen Jahren besonders von Hitze betroffen war.

Hierfür verwendeten wir die Hitzewellen-Definition nach Kysely, wonach eine Hitzewelle festgestellt wird, sobald eine Temperatur von 30 °C an mindestens drei Tagen in Folge überschritten wird und so lange anhält, wie die mittlere Maximaltemperatur über die gesamte Periode über 30 °C bleibt und an keinem Tag eine Maximaltemperatur von 25 °C unterschritten wird.

Nach diesem rigorosen Aussortieren blieben glücklicherweise noch genug Aufnahmen übrig, um alles zu visualisieren, was wir wollten: Die Situation in Städten am Tag und in der Nacht und alle Oberflächentemperaturen in Hitzephasen für ganz Deutschland als interaktive Karte.

Ein weiterer Punkt stellte uns vor eine Herausforderung, denn:

6. Selbst NASA-Daten sind nicht perfekt

Um eine interaktive Karte zu bauen, konnten wir die Hitzewellen-Daten nicht einfach nach ihren Koordinaten auf einer Deutschlandkarte visualisieren.

Das liegt zum einen daran, dass die Wärmebilder an unterschiedlichen Tagen aufgenommen wurden und verschiedene Faktoren wie die Zusammensetzung der Atmosphäre die Werte beeinflussen. Zum anderen mussten wir feststellen: Manche Aufnahmen hatten Löcher.

Zwei Landsat-8-Aufnahmen von Deutschland, die dieselben Datenlücken aufweisen (NASA/BR)

Alle Aufnahmen eines betroffenen Ortes zeigten dieselben Datenlücken, weswegen es sich um einen systematischen Fehler handeln musste. Dieser hatte nichts mit unserer Analyse zu tun, sondern mit den Daten selbst.

Die NASA stellt nicht nur die aufgenommene Wärmestrahlung, sondern auch die in Temperaturen umgerechneten Werte zur Verfügung, die „Landsat Collection 2 Level-2 Science Products“.

Um dieses Datenlayer zu berechnen, verwendet die NASA Daten das „Global Emissivity Dataset“ von ASTER, einem anderen Satelliten. Wenn in diesem Datensatz Fehler oder Lücken durch Bewölkung auftauchen, fehlen die Daten auf mysteriöse Weise auch im Landsat-Datensatz.

In einigen Fällen dominierten die Lücken den visuellen Gesamteindruck der Bilder. Daher haben wir eine Methode entwickelt, um die Datenlücken zu schließen. Sie besteht aus zwei Schritten:

  • Der Berechnung einer bestmöglichen Abschätzung der fehlenden Daten.
    Dazu nutzten wir die Tatsache, dass die Temperatur von ihrer Zusammensetzung abhängt: Stahl, Asphalt oder Steine erhitzen sich jeweils auf eine bestimmte Weise, Gewässer, Wiesen oder Wälder auf eine andere.
    Daher konnten wir die Daten der anderen Satelliten-Bänder (also die Daten der anderen Wellenlängenbereiche) nutzen, um die Oberflächentemperatur an einem Ort mit Hilfe von statistischen Korrelationen zu schätzen.
  • Im zweiten Schritt haben wir die Datenlücken mit den approximierten Daten gefüllt und mit einem Verfahren namens Poisson-Blending eingepasst, um sichtbare Ränder zu vermeiden. Das Poisson-Blending ist ein Verfahren aus der Bildverarbeitung, um Bildinhalte nahtlos in ein anderes Bild einzufügen. Z. B. nutzt der Reparatur-Pinsel in Photoshop diesen Algorithmus.

7. Was man braucht: Ideen, Speicherplatz und Statistik…

Wer etwas Ähnliches plant, sollte keine Angst vor großen Geodaten-Sätzen haben: Rohdaten und Zwischenergebnisse benötigten in unserem Fall etwa 2 Terabyte an Speicherplatz.

Die interaktive Deutschlandkarte ist knapp 18 Milliarden Pixel groß. Ein kompletter Durchlauf aller Verarbeitungsschritte würde mehrere Wochen dauern und konnte nur durch Cloudcomputing auf wenige Stunden reduziert werden.

8. … und ein interdisziplinäres Team

Wer jetzt denkt, das ist aber ganz schön kompliziert, hat recht. Ohne geballte Statistik-, und Programmierkompetenz hätte diese Datenauswertung nicht geklappt.

Die Teams von BR Data und dem BR AI + Automation Lab vereinen alle Kompetenzen, die für komplexe Datenrecherchen wie diese nötig sind: Von der Auswertung der Geo-Daten (Michael Kreil, Marco Lehner) über die Erstellung der Grafiken (Steffen Kühne, Oliver Schnuck), der Programmierung interaktiver Webinhalte (Sebastian Bayerl, Steffen Kühne) bis hin zur journalistischen Recherche und Umsetzung des Themas (Rebecca Ciesielski, Oliver Schnuck) und einer datenkompetenten redaktionellen Abnahme (Helga van Ooijen, Robert Schöffel).

Recherchen wie diese passen perfekt zu BR Data und dem BR AI + Automation Lab, denn das journalistische Arbeiten mit Algorithmen und großen Datensätzen ist ein zentraler Teil unserer Mission.

Dreamteam Satellitendaten, Journalismus und KI

Aber man muss nicht immer mit großen Datensätzen arbeiten, um eine gute Geschichte zu erzählen, auch einzelne Satelliten-Bilder können dabei helfen.

Das Global Investigative Journalism Network hat wichtige Quellen und Links zum Thema zusammengefasst. Wer nach Inspiration sucht, wie sich Satelliten-Bilder mit anderen Datenquellen für investigative Recherchen verbinden lassen, findet sie auf dem Blog von Ben Heubl.

Oder direkt bei Unternehmen, die in diesem Bereich arbeiten. Hier sind die Trends — hochaufgelöste Daten und KI-Objekterkennung — längst angekommen, die von Journalist:innen noch wenig genutzt werden.

Das Unternehmen Orbital Insights nutzt zum Beispiel eine automatisierte Bilderkennungs-KI, um anhand der in Satelliten-Bildern sichtbaren Schatten in Öltanks die globalen Rohölbestände abzuschätzen.

Auch einige wenige Medien haben sich schon an Satelliten-KI herangewagt. Zum Beispiel hat die argentinische Tageszeitung La Nación zusammen mit einem auf Satellitendaten spezialisierten Unternehmen den Ausbau von Solaranlagen in Argentinien analysiert.

Es gibt also noch viele Möglichkeiten, wie Newsrooms und Rechercheteams künftig von Satellitendaten profitieren können.

--

--

Rebecca Ciesielski
BR Next
Writer for

Journalistin | Bayerischer Rundfunk | BR AI + Automation Lab