Store mængder råstof til redaktionelt indhold er tilgængeligt — men bruges næsten ikke

Fem former for data og nye datastrømme vil fremover blive stadigt mere værdifulde som led i fødekæden bag indholdsproduktion — og et nyt mulighedsrum for nyhedsmedier og samfundskommunikation

DMJX
DMJX
Jun 27 · 14 min read

Af Lars Kabel, lektor, cand.phil. og journalist, DMJX

ørst et postulat og en tese: Store mængder råstof med betydelig nyhedsværdi findes nu i form af data og datastrømme, der kun i meget begrænset omfang bliver brugt af nyhedsmedier og i den borgerrettede kommunikation. Nyhedsdækningen og beskrivelsen af samfundet vil i stigende omfang kunne baseres på inddragelse af disse data og datastrømme.

Hør Lars Kabel forklare om baggrunden for projektet om digitale datastrømme.

Udgangspunktet for tesen er det aktuelle danske mediesystem, der blev opbygget i 2000’erne og 2010’erne, den nuværende digitale medieøkologi og brugernes efterspørgsel på mobilt indhold, hvor de er, når de er der:

”Stort set alle mennesker i verden skaber dagligt digitale data ved brug af computer, tablet eller telefon. Også et stigende antal genstande skaber digitale data, som vi kender det fra fx droner, ’intelligente biler’ og varmesystemer. Det globale internet sørger for lynhurtig deling af en stor mængde af disse data, hvad enten de skabes af humane eller ikke-humane aktører” (Drotner: 12).

Denne udvikling er blandt andet et spejl af, at folk er strømmet ind til de store og mellemstore byer de seneste årtier, og at urbaniseringen kører derudad. Livet leves i stigende omfang i offentlige byrum og i rummene mellem husene. Samtidig er fællesaktiviteter i sport og kultur og mere og mere af hverdagslivet flyttet fra indendørs til udendørs, og byerne indrettes nu derefter. De gøres til rum for livsudfoldelse og er i stigende omfang faciliteret af digital infrastruktur.

Teknologisk er vi kommet langt, knapt så langt er vi kommet med, hvad teknologierne og den megen data kan bruges til. Hvilket nyt værdifuldt indhold kan der skabes? Hvilke nye typer af interaktioner kan etableres?

I 2020 starter opstillingen i Danmark af den teknologi, der skal bruges til stærkt 5G-mobiltelefoni. Sammen med Internet of Things-genstande varsler 5G et teknologisk kvantespring.

Denne artikel vil forsøge at bidrage med en ny systematisering og identifikation samt karakteristikker af fem former for data og nye urbane datastrømme, der i dag er og fremover vil blive stadigt mere værdifulde som led i fødekæden bag indholdsproduktionen. Artiklen vil beskrive og anbefale et nyt mulighedsrum for nyhedsmedier og samfundskommunikation. Ikke mindst fordi det kommende Internet of Things vil skabe nye typer af datastrømme med værdi for medier og samfundskommunikation

De danske medier og kommunikationsafdelinger er godt i gang med at bruge de fire første dataformer, men ikke den femte. Her er de knapt begyndt — her ligger mulighedsrummet!

De fem former for data og databehandling

Et vigtigt redskab til brugen af data er et overblik, en karakteristik af de fem forskellige former for data og databehandling, der udvikles og praktiseres i disse år. Noget af denne indsats er naturligvis kommet før noget andet og har dannet udgangspunkt for det nye. Historisk set er der dog tale om en form for tidslinje gennem de seneste ca. 30 år, men de nye datatyper og databehandlingsformer har ikke afløst de tidligere. De eksisterer side om side og tages i brug til forskellige formål, de konvergerer, og der skabes interaktion imellem dem. Hver af de fem former er et betydeligt undersøgelsesfelt i sig selv, men med det formål at skabe overblik er de her beskrevet i fortættet form:

Foto: Vitaly Vlasov

Open data

Datajournalister indsamler kvantificerbare data i databaser, offentlige arkiver i DK og EU og laver supplerende onlinesøgninger. De analyserer offentlige data ved hjælp af spreadsheets og statistiske programmer, studerer politiske, sociale og demografiske forandringer ved hjælp af ’geographic information mapping software’ (GIS) til urbane visualiseringer. De udfører sociale og kommercielle netværksanalyser og magtanalyser ved at sammenkøre navne med professionelle positioner og forskellige typer af relationer for eksempel bestyrelsesposter.

Før resultaterne kan offentliggøres skal en vinkel i en datajournalistisk analyse altid afprøves mod virkeligheden ofte ved hjælp af klassiske journalistiske metoder som interview. Nyhederne opstår gennem mønstrene og tilgængeligheden ved hjælp af sammentænkning og visualisering af tusindvis af informationer.

Som noget nyt i Danmark er adgangen til offentlige data i en bearbejdet form nu gjort meget tilgængelig gennem Open Data. Det startede i 2013. Den følgende beskrivelse er gengivet fra Media Connectivity:

Open Data DK er en forening for danske kommuner og regioner. Portalen opendata.dk har til formål at skabe transparens i den offentlige forvaltning og grobund for datadreven vækst. Og dermed få merværdi ud af de mange data, der i forvejen indsamles… På opendata.dk stiller de bagvedliggende offentlige forvaltninger data gratis til rådighed for alle, der kan gøre brug af dem”.

På Open Data DK kan der findes andre typer af datasæt om kommunerne, regionerne og borgerne end hos Danmarks Statistik. I april 2018 var der på nationalt plan 913 datasæt til rådighed… Det var data om fysiske forhold som løberuter, storbyhaver og antallet af kolonihaver og fiskepladser. Om lysstyrker, el ledninger og udskiftning af LED-pærer. Om luftfugtighed og planer ved skybrud. (Kabel: 48 og 49)

Smartphones er det altdominerende apparat til modtagelse og interaktion med mediehuse og kommunikationsafdelinger. Mobiltelefonerne øger efterspørgslen efter indhold, der er individualiseret og direkte målrettet til et sted og et tidspunkt. (Foto Rasmus Steengaard)

Der er flere eksempler på åbne data i Open Data DK, der har potentiale til at kunne blive til nyheder. Et eksempel er datasættene i Viden om dit affald i Aarhus kommune. Her tilbydes både et overordnet billede af de affaldsmængder, som borgerne leverer på genbrugsstationerne, hvor og hvornår de gør det, samt nogle detaljerede målinger af, hvad borgerne smider i deres skraldespande af madaffald, restaffald og emballage af plast og metal m.m. Alt data er visualiseret, så det er let tilgængeligt. Ved at etablere tværgående sammenhænge imellem de forskellige typer af oplysninger kan der eksempelvis laves hyperlokale nyheder fra et bykvarter om affaldssituationen. Datasættene er dog ikke dynamiske, det vil sige, at de ikke opdateres løbende men giver et billede i datid af forholdene. Datidsbilledet vil en nyhedsredaktion så kunne supplere med eksempelvis opfølgende interview om den aktuelle status på området. På den måde kan databaserede oplysninger understøtte det løbende arbejde med nyhedsformidling. Data bliver til en del af fødekæden bag nyhedsproduktionen.

Lækket data

Domænet wikileaks.org blev registreret 4. oktober 2006 af den australske journalist Julian Assange. Det første dokument, der blev offentliggjort, kom på hjemmesiden i december samme år. WikiLeaks publicerer lækkede, hemmeligt stemplede dokumenter på nettet samtidig med at kilderne, hackerne og whistleblowerne tilbydes anonymitet.

Med WikiLeaks opstod der helt nye muligheder for mediehuse og gravende journalister over hele verden for at få adgang til store mængder af data med potentiel meget stor nyhedsværdi og samfundsbetydning.

I 2010’erne har denne form for læk af ofte fortrolige dokumenter og efterfølgende databehandling resulteret i nogle meget bemærkelsesværdige sager. I oktober 2010 offentliggjorde WikiLeaks 400.000 militære rapporter fra Irakkrigen. Hacket blev leveret af den amerikanske soldat Chelsea Manning, og måneden efter gennemførte WikiLeaks offentliggørelsen af 252.287 dokumenter udarbejdet af de amerikanske ambassader. Dokumenterne var fyldt med kontroversielle og fortrolige oplysninger, WikiLeaks samarbejdede med mediehuse i mange lande, og de fandt ’breaking news’ med stor betydning i dokumenterne, der dominerede forsiderne og satte dagsorden i mange lande.

Panama Papers er det måske til dato mest bemærkelsesværdige eksempel på datajournalistisk og redaktionel behandling af enorme mængder af dokumenter, filer og data. Andre eksempler fra dette årti er OffshoreLeaks og SportsLeaks.

I Panama Papers blev ikke mindre end 2,6 terrabyte data i 2015 overført af en anonym kilde til den tyske avis Süddeutsche Zeitung. Det var ifølge Wikipedia et sæt data bestående af 11,5 mio. hemmelige dokumenter, udarbejdet af det panamanske selskab Mossack Fonseca, og som rummede informationer om mere end 214.000 offshore selskaber og en masse magthavere i mange lande.

I forhold til datajournalistik og håndtering af de store datamængder blev Panama-afsløringerne et mønstereksempel på, hvad internationalt samarbejde mellem mediehuse og journalister i mange lande kan resultere i. I regi af International Consortium of Investigative Journalists (ICIJ) samarbejdede 376 journalister fra 107 nyhedsorganisationer i mere end 80 lande om at finde nyheder og afsløringer i det enorme materiale, men først måtte datasættene renses og katalogiseres systematisk, før der kunne søges og laves sammenligninger. Blandt andet skulle der konstrueres søgemaskiner, der var i stand til at grave sig ind i tusindvis af dokumenter og finde mønstre, udføre navne- og keywords-søgning.

I Danmark har tre graverjournalister fra Berlingske de senere år og bid for bid afdækket en af de største bankskandaler i danmarkshistorien — hvidvask gennem Danske Bank. Siden marts 2017 har sagen været et eksempel på, hvordan avanceret databehandling af lækkede dokumenter kan bidrage til afsløringen af en stor skandale udført af en samfundsbærende institution som Danske Bank.

Hvidvasksagen og den journalistiske indsats omkring den udmærker sig dog ved, at det ikke blot var data fra dokumenter men en række af de grundlæggende journalistiske arbejdsmetoder, der undervejs bidrog til afsløringsarbejdet. Dermed er danske Bank-afsløringerne et helt aktuelt eksempel på, hvordan en unik kombination af avanceret databehandling med klassisk journalistik kan føre det et nyhedsflow med megen stor samfundsmæssig betydning.

Brugerdata

I det seneste årti er nyhedsmediernes og kommunikationsafdelingernes adgang til store mængder af data om deres læseres, brugeres og interessenters adfærd på internettet øget markant. Dataformen kaldes af mange for ’big data’ og bruges blandt andet til kortlægning af den faktiske kommunikation omkring mediehusets indholdsstrømme. Terminologien er dog ikke forbeholdt dette område, i andre af de fem dataformer er der også store mængder af ’big data’ i spil. Nyhedsmedierne og virksomhederne opbevarer og bearbejder de data, som brugerne efterlader sig, når de bevæger sig rundt på onlineaviser, hjemmesider, nyhedsbreve m.m. Det giver med stor præcision redaktionerne dyb information om, hvem brugerne er, hvor de kommer fra, hvad de læser, hvordan historier bevæger sig rundt mellem medier og platforme og meget, meget mere.

Som det på bedste vis er beskrevet i Fagenes fremtid fra 2019 i delrapport 3 om Kommunikationsfagenes fremtid fra Dansk Journalistforbund gør ”datafiseringen kontakten til brugerne målrettet og målbar”:

Enhver, der for nylig har sat sine ben i sekretariatet på et nyhedsmedie, vil have bemærket skærmene i loftet. Dashboards, der via systemer som Chartbeat, Google Analytics eller Parse.ly viser trafikken på mediernes hjemmeside — i realtid. Antallet af brugere på de enkelte historier, læsetiden på historierne, hvilke websites brugerne er blevet henvist fra osv. Den konstante måling af brugernes adfærd er det mest synlige eksempel på, at online-journalistikken på bare et par år er blevet uløseligt koblet til data”. (Kommunikationsfagenes fremtid: 29)

I journalistisk sammenhæng og i forhold til, hvad data kan bruges til, er timing afgørende. Redaktionerne må i høj grad vurdere, hvad der skal til for, at en nyhed eller en anden type af historie slår igennem på et bestemt tidspunkt. I den sammenhæng er brugerdata et relativt nyt og vigtigt redskab.

Mediernes og kommunikationsafdelingernes data om brugerne er også et centralt råstof i de igangværende bestræbelser på at lave mere geolokaliseret og individualiseret indhold med ’microtargeting’ helt frem til den enkelte. Både håndholdt og automatiseret. Brugerdata er en forudsætning for at kunne lave denne form for målrettethed i dybden. Hvad præcist efterspørger læseren og brugeren, hvor og på hvilket tidspunkt i døgnet? Det kan en analyse af brugerdata give stadigt mere detaljerede svar på, og det kan danne udgangspunkt for, hvilket personificeret stof den enkelte skal tilbydes blandet sammen med det indholdsflow, der er rettet mod alle.

Eksempler på medier i Danmark, der de senere år er kommet i gang personificeret indhold og ’microtargeting’ er Herning Folkeblad og Jysk Fynske Medier. I begge tilfælde er deres udviklingsarbejde støttet af fondsmidler fra Google News Initiative:

Herning Folkeblad fik i december 2017 1.5 mio. kr. fra Google til at udvikle en platform til brugertilpasset indhold, der ved hjælp af algoritmer kunne præsentere brugerne af folkebladets websites: aoh.dk og mja.dk for et mere persontilpasset lokalt nyhedsudbud. Har en læser via sit læsemønster vist særlig interesse for sport, vil sport fylde mere på vedkommendes forside. En sådan personalisering af indhold bygger på detaljerede og kombinerede brugerdata.

Mediehuset er kommet langt i arbejdet med at realisere projektet og målsætningerne. Ifølge chefredaktør for Herning Folkeblad Alex Nielsen, citeret i Journalisten 4. april 2019, betyder forandringerne, at ingen af læserne eller brugerne nu præsenteres for de samme nyhedssider. De pushede sider afhænger af læserens forudgående adfærd på sitene.

Nyhedsaviser har altid prioriteret, hvad der skal med på siderne, og hvad der er det vigtigste til forsiderne. Nu forbedrer algoritmerne muligheden for at foretage disse valg versioneret og målrettet den enkelte læser. Ifølge chefredaktør Alex Nielsen begynder bladhuset at kunne skimte de første resultater af indsatsen:

Vi kan tydeligt se, at folk bliver hos os i længere tid. Det tolker vi sådan, at modtagerne oplever en større relevans, når de får nyheder i et mix mellem, hvad vi publicistisk vælger til dem, og hvad de får fremtrukket fra nyhedsbuffeten på baggrund af deres adfærd og ønsker (Journalisten: 04.04.2019).

Jysk Fynske Medier modtog i marts 2019 2,3 mio. kr. fra Google til udvikling af personlige og hyperlokale nyheder på deres mange digitale platforme. Målet er, at den enkelte bruger præsenteres for et mix af fælleshistorier og hyperlokalt indhold uanset om brugeren besøger hjemmesiden, læser et nyhedsbrev eller får en notifikation i en app. Igen bygger denne målrettethed på brugerdata.

Ifølge Claes Holzmann, data- og analyseredaktør i Jysk Fynske Medier er individualisering et velkendt fænomen i mediebranchen:

Det, som gør vores projekt anderledes, er den lokale dimension. Vi skal ramme folk med noget, som både er lokalt og inden for det, de interesserer sig for. (Journalisten: 21.03.2019).

Sociale data

Mængden af data om brugerens adfærd stiger ekspotentielt ikke alene i form af brugerdata hos nyhedsmedierne og kommunikationsafdelingerne men også i databaserne under de sociale medier.

Medieplatforme som Facebook og det tilknyttede Messenger, Twitter, Snapchat, Linkedin og Instagram er i udgangspunktet ikke publicistiske medier, ikke nyhedsmedier, selvom de distribuerer masser af nyheder som tekst, video og fotos, men det er indhold, som andre har skabt. Deres ideale mål er at forbinde mennesker rundt i hele verden, tilbyde kommunikation og skabe demokratisering. Deres forretningsmodel er annoncering og services såsom eksempelvis netværksskabelse baseret på målrettet avanceret datahåndtering samt dataprofiler over den enkelte bruger. De sociale medier er IT-platforme, der er designet til at opbygge relationer, og som stiller publicerings- og interaktionsmuligheder gratis til rådighed for alle og for nærmest alle former for indhold, som det er lovligt at offentliggøre og sprede. Også for nyhedsmedierne. Brugeren betaler med sine data, brugerens data er koncernernes primære produkt.

I Danmark er Facebook fortsat det dominerende sociale medie med omkring 3,7 mio. brugere i 2018, ca. 75 procent af befolkningen. Det hyppigt omtalte Twitter blev i 2018 ifølge DR Medieforskning kun brugt af 6 procent af danskerne, hvoraf blot en mindre del var aktive. Og for første gang i 10 år så man i 2018 et mindre fald i brugen af Facebook som nyhedsplatform i Danmark.

Det er en kendt sag, at Facebook og andre indsamler, opbevarer, bearbejder og udnytter enorme mængder af data om hver eneste af de milliarder af brugere, de har jorden rundt. Tal er svære at håndtere i relation til Facebook, de er astronomiske. Alle typer af informationer: billeder, netværk og reaktioner registreres, men den opbevarede data er ikke hemmeligholdt, man kan via sin Facebookprofil få information om de data, som Facebook opbevarer om en selv. Facebook har ifølge danske brugere, der har søgt indsigt, ofte mere end en gigabyte almen information og adfærdsdata opbevaret om en person, der har brugt tjenesten på en almindelig måde gennem 10 år.

De store datamængder som Facebook og andre sociale medier indsamler, opbevarer og udnytter kommercielt ejes og kontrolleres af techkoncernerne. Og de bruges af algoritmerne, som er ’rating systemer’, der kontrollerer, hvilke typer af indhold, der fremmes eller nedprioriteres. Det er gået ud over nyhedsmediernes indhold de seneste år.

Samtidig med denne udvikling dæmper mange nyhedsmediehuse selv deres aktiviteter på Facebook og de andre sociale platforme, fordi de ønsker at råde over deres egne brugerdata. De tilstræber i mindre grad end tidligere at stille gratis indhold til rådighed for de store amerikanske techkoncerner, der ejer de sociale platforme.

Ifølge en nyligt udgivet forskningsartikel må nyhedsmedierne i en vist grad underlægge sig de sociale mediers logikker og de måder, som de sociale medier med brug af data målretter indhold på. I hvert tilfælde hvis de ønsker at have en markant tilstedeværelse på platformene. I artiklen News criteria on social media. Comparing news media use of Facebook and Twitter af Jakob Linaa Jensen, (Journalistica, nr. 1, 2019) konkluderes det, at der er en historisk udvikling i det spredte på sociale medier, men at det langt hen stadigvæk gælder, at:

News spread through social media might be framed differently than stories in traditional media. Emotions and sensations rather than facts dominate because social media have “different subjects, different narrative, sensibility and different pathways to capture the attention. Furthermore, when news selection and reading are increasingly based on popularity, ‘likes’ and ‘shares’ rather than traditional editorial filters, the spectacular, the entertaining the personal or the conflicting might come to dominate the news cycle (Mayer et al, 2010)”, (Jensen: 94).

Urbane data

Data og ’big data’ har været på banen i årtier, urbane datastrømme er det nye element i datafødekæden. Urbane data er de data, der opstår via eksempelvis mobil tracking af anonyme deltageres, brugeres og borgeres bevægelsesmønstre rundt i offentlige bygninger, udendørs byrum og rundt ved store events. Ud af analyser og samkøringer af sådanne data kan der hentes nyheder og skabes mønstre, der kan bruges til korte nyheder og forbedret adfærdsregulerende service under et stort event samt meget mere.

Som kort beskrevet i indledningen til denne artikel og dybere fremlagt i bogen Media Connectivity (Kabel, 2019) er Danmark et af de mest gennemdigitaliserede samfund i verden. Urbaniseringen kører, og stedets betydning som definerende kontekst er stigende — kommercielt og redaktionelt.

Offentlige byrum bliver i stigende omfang udrustet med sensorer og skærme af forskellige slags, der monitorerer omgivelserne i realtid. Her fra havnepladsen i Aarhus. Data fra sensorerne er ny en ressource for nyheder i nutid også til sociale medieplatforme. (Foto: Rasmus Steengaard)

I en del internationale metropoler og i store og mellemstore byer overalt i verden, også i København og Aarhus, er den første fase af den digitale infrastruktur ved at være på plads. I hvert tilfælde som testopstillinger til fri afbenyttelse for virksomheder, innovatører, offentlige forskningsinstitutioner som universiteter og professionshøjskoler og myndigheder.

Den for borgerne helt afgørende teknologi er fortsat smartphonen, håndholdte tablets og laptops samt 4G-mobilteknologi.

De på nuværende tidspunkt mest modne byrumsteknologier er Wi-Fi, små og store interaktive skærme i offentlige rum samt forskellige sensorer, kameraer, mikrofoner og målere/trackers. De er nu placeret udendørs og indendørs i betydeligt antal og tilbyder en form for 1. generations-infrastruktur for urban kommunikation. (Kabel: 139).

Som et element i det høje niveau af digitalisering i Danmark er der i de to største byer Aarhus og København skabt nogle områder, hvor den digitale infrastruktur er udviklet særligt højt. Det samme er sket i en række andre europæiske byer. I København hedder området Copenhagen Street Lab, hvilket er et urbant testområde bestående af Rådhuspladsen, H.C. Andersens Boulevard med 60.000 biler i døgnet, Vester Voldgade, der er trafiksaneret til fordel for cyklister og fodgængere samt Christians Brygge med BLOX. Copenhagen Street Lab er et sted, hvor industripartnere og offentlige institutioner som universiteter kan afprøve nye teknologier. Man ser, hvilke data, der frembringes, hvilke værdier og problemer de skaber, og derefter besluttes det, om teknologierne kan/skal rulles ud over byen.

I Aarhus hedder test- og udviklingsområdet Aarhus City Lab. Det er et større areal fra Agro Food Park i Skejby til Dokk1 og den nye havneplads i centrum af byen. Området huser institutioner og erhvervsklynger som Aarhus Universitetshospital, Agro Food Park, IT-byen Katrinebjerg og Energi Hub Navitas.

Denne artikel har forsøgt at give bidrag til vidensudviklingen ved at identificere og beskrive fem for data og urbane datastrømme, som er råstof til nyheder og andre typer af redaktionelt indhold fra nyhedsmedier og borgerrettede kommunikationsafdelinger og virksomheder.

De danske medier og kommunikationsafdelinger er godt i gang med at bruge de fire første dataformer. Ikke den femte. Her er de knapt begyndt — her ligger mulighedsrummet! Ikke mindst fordi det kommende Internet of Things vil skabe nye typer af datastrømme med værdi for medier og samfundskommunikation.

Så på området urbane data er der masser af uudnyttede muligheder for nyhedsredaktioner og kommunikationsafdelinger.

Litteratur

Berlingske (4/1 2019): Overblik: Så vidtrækkende er hvidvaskskandalen i Danske Bank. Artikel

Dansk Journalistforbund (2019): Kommunikationsfagenes fremtid. Udfordringer og muligheder for kommunikatører i Danmark. Delrapport 3

Drotner, Kirsten og Sara Mosberg Iversen (red) (2017): Digitale metoder. At skabe, analysere og dele data. Samfundslitteratur

Journalisten (21/3 2019): Fire danske projekter deler 7,7 mio. fra Google-fond. Artikel

Journalisten (4/4 2019): Google-penge har ført til længere læsetid på Herning Folkeblad. Artikel

Jensen, Jakob Linaa (2019): News criteria on social media. Comparing news media use of Facebook and Twitter. Journalistica nr. 1, 2019

Kabel, Lars (2019): Media Connectivity. Urban teknologi, data, journalistik og reklame I den digitale by. Forlaget Ajour

Kabel, Lars (red) (2009): Nyheder i nutid. Forlaget Ajour.

Léchenet, Alexander (2014): Global Database Investigations: The role of the computer-assisted reporter. Reuters Institute Fellowship Paper, University of Oxford

Wikipedia om Panama Papirerne, Wikileaks m.m.

MediaJournal

Danmarks Medie- og Journalisthøjskoles online-tidsskrift med bidrag fra undervisere og forskere. Udkommet løbende siden oktober 2018.

DMJX

Written by

DMJX

Danmarks Medie- og Journalisthøjskole.

MediaJournal

Danmarks Medie- og Journalisthøjskoles online-tidsskrift med bidrag fra undervisere og forskere. Udkommet løbende siden oktober 2018.