Larger than Life — sådan virker Facebooks algoritmer. Bedste Big Data case #5.

Jon Lund
Jon Lund
Published in
7 min readApr 1, 2014

Ligesom Google kan Facebook takke data — og masser af dem — for alt. Men på en anden måde. Hos Facebook er det ikke nettet der analyseres. Det er dig selv og dine venner, som de store datamængder kaster nyt lys over. Og redskaberne hedder blandt andet Edgerank, Custom- og Lookalike audience. Her kommer nummer fem i min “de bedste Big Data-cases jeg kender”-kavalkade.

Facebook er gigantisk. Mere end hver sjette (!) menneske på kloden tjekker ind på det sociale netværk hver måned, halvdelen af dem besøger sitet dagligt og når de gør det, bruger de i snit 17 minutter. Noget der — sidst jeg så efter — minder om extreme 20% af al den tid, der overhovedet bruges på nettet, lægges hos Facebook.

Mål OG middel
I et Big Data perspektiv er det ikke de rå mængder i sig selv der er fascinerende, men derimod den måde Facebook bruger dem på. For de mange posts, likes og kommentarer tjener et dobbelt formål: de er både det “produkt” som vi som brugere sætter til livs, når vi er på. Men de mange data udgør også den maskine der frembringer produktet. De er både mål og middel for indholdet. Og alle de annoncer, der giver Zuckerberg & co smør på brødet, for den sags skyld.

Usynlig skov
Først og sidst er Facebook dine venner. Og jeres indbyrdes relationer — dine vennekredse. Som er noget uhåndterligt noget. For selvom du selv kan pege på hvem du anser for dine venner, hvem der står dig nær og fjern, er det kun dit eget billede af vennekredsen du på den måde kan få frem. Du har helt sikkert glemt nogen, som andre ville tage med. Og taget nogen med, som andre ville udelade. Og du har måske en ret god fornemmelse af, hvem du står nær. Men ikke nær så god fornemmelse af hvem de andre står nær.

Hos Wolfram Alpha (prøv her) kan du visualisere din Facebook-vennekreds, og afsløre lidt af de indsigter, Facebook selv besidder om dig. Her er mine egne 599 Facebook-venner. De er ordnet i vennekredse, hvor dem med mange indbyrdes forbindelser (venskaber) er tæt på hinanden og dem med færre er fjernere fra hinanden. Og så er de vigtigste farvekodede. Min far, på billede f.eks. ses at stå ovre i den mindre tætte højre halvdel (det er familien derovre) og han har to farvekoder: han er top “social insider” hvilket betyder vi har mange fælles venner, og så er han top “social connector” hvilket betyder, at han har venner i flere af “mine” venskabskredse.

Det sande billede opstår først, når du får kortlagt alle på en gang. Det er det Facebook kan. Zoome ud, så det sande billede kommer frem. Selv kan du ikke se skoven for bare træer.

Edgerank — den hemmelige formel
Men det kan Facebook. For hver af os — dig, mig og alle de andre Facebook-brugere — har Facebook tegnet en profil. Den viser hvem vores venner er, hvem vi er tæt på, i hvilke sammenhænge vi er tæt på hinanden. Den viser hvilken slags updates vi godt kan lide — og fra hvem! — hvilke typer historier vi typisk klikker på. Og en masse andet. Algoritmen der ligger bag er kendt som Edgerank. Eller var. For med systemets stigende kompleksitet er den enkle formel nok død. Men logikken ikke. Den er bare blevet endnu mere avanceret.

Facebooks edgerank-algoritme i sin klassiske form. Det du ser i din nyhedsstrøm er udvalgt efter hvor tæt du er på den der har postet det (affinity), om det er et link, opdatering, billede eller video, der er tale om (weight — jo tungere, jo bedre) og så hvor lang tid siden det er at opdateringen fandt sted (decay). I dag er der mange flere faktorer der spiller ind.

Din helt personlige strøm
Hvis du tror dit facebook-feed holder dig fuldt opdateret om din vennekreds’ Facebook-gøren og laden tager du fejl. Det er kun de sjoveste og mest interessante af dine venners Facebook-opdateringer der havner i din nyhedsstrøm. Rigtigt meget andet sorteres fra. Og det er “Edgerank” og dets indblik i hvem du i virkeligheden gerne vil høre fra, og hvem du i virkeligeheden helst vil have druknet, der står bag. Selv folk som du — på papiret — deler 100% vennekreds med — vil derfor se noget andet end du selv ser, når de logger på. Og det er lige her du allermest tydeligt ser Big Data — i skikkelse af “Edgerank” — stikke hovedet frem hos Facebook. Det er Big Data der orkestrerer dette verdens største hyper-lokalt/private medie. Big Data — den store redaktør.

Dine helt egen reklamer
Det er de samme mekanismer Facebook bruger når det gælder reklamer. Også her udvælger Facebook hvilke annoncer du skal se ud fra din profil. Og hvor meget du skal se til dem.

En visnings-strategi, som annoncøren kan vælge, handler om engagement. Altså at annoncen skal vises til dem blandt den valgte målgruppe — kvinder, 25–35 år, f.eks — som må forventes at like eller klikke på den. Er den valgt, tjekker Facebook dine — hvis altså du er kvinde mellem 25 og 35 år — klik- og like-vaner før de bestemmer om du skal have reklamen at se. Og tjekker efter om dem der allerede har klikket på reklamen iøvrigt ligner dig. Hvis de gør, er chancen for at du også får den at se, større. Gør de ikke, er den mindre. Sådan lyder ihvertfald logikken bag.

Hvem vil du ramme? Klik på en knap og Facebooks Big Data maskine tager sig af resten. Screendump fra Facebooks annoncemodul.

Facebook har også andre visningsstrategier. Reach, f.eks., hvor annoncen bare vises til så mange som muligt i den målgruppe du har defineret. Eller effekt, hvor annoncen vises til dem, der ikke bare klikker eller liker annoncen, men til dem, der klikker videre ud til annoncørens eget site. På den måde bruger Facebook alle deres Big Data til ikke bare at give en god service, men også tjene penge.

Fortæl mig hvem du er
Jeg har både her og i mine øvrige Big Data-cases fokuseret meget på hvilke mønstre, som ellers ville være usynlige, som opstår, når data bliver store nok. Men det er ikke den eneste måde at skumme Big Data fløden på. En anden, lidt mere simpel, men alligevel ekstrem potent måde at gøre det samme viser Facebook i deres “custom audience”. Fordi der er så ekstremt mange brugere på Facebook, og fordi Facebook ved hvem de er, kan Facebook tilbyde at lave håndplukkede målgrupper helt ned på individ-niveau.

Reklame med målgruppe på 1: Min kone. Ingen andre end Mette får denne at se i sit newsfeed. Det er “custom audience” hos Facebook i praksis.

Alt det kræver for at ramme en uskyldig tredjepart med en annonce — eller sponseret opdatering — er en emailadresse eller et Facebook-profilnavn. Ca en halv time efter du har tastet det ind, vil annoncen begynde at køre. Det er lidt dyrere end normalt — en krone eller to per visning. Men til gengæld er det også kun den eller de helt få udvalgte der ser hvad du skriver, så der er ingen spildte penge på fejlvisninger. Og du kan personliggøre din annonce i helt ekstrem grad. Hvad med “Tak for i går — har du tænkt over tilbuddet” til kunden fra i går? Eller “Jeg elsker dig, Mette” til dit livs udkårne?

Statistiske tvillinger
Big Data hos Facebook er “Edgerank” og din personlige strøm af indhold og reklamer. Det er “custom audience” og super-segmenterede målgrupper. Og så er det en tredje ting, som blander de to: “lookalike audiences”. Eller “statistiske tvillinger”, som fænomenet også kaldes.

Ideen er simpel: Du tager en gruppe brugere, som du ved er i din målgruppe. Og så beder du Facebook finde andre brugere der — statistisk — er magen til. Med almindelige annoncering hos Facebook starter du med en traditionel målgruppe a la kvinder mellem 25 og 35 år, og her prøver Facebook så at finde frem til dem, som reagerer bedst på din reklame. Men sådan er det ikke med “lookalike audience”. Du starter fra scratch og beder Facebook helt selv definere hvad det egentligt er, der kendetegner målgruppen.

Hvordan Facebook gør, vides ikke. De holder kortene tæt til kroppen. Men det er nærliggende at tro, at de tager hele deres arsenal af viden i brug: demografiske oplysninger (køn, alder, bopæl etc.), interesser og sider du liker. Adfærdsoplysninger (tilbøjelighed til at klikke, kommentere, tjekke ind og like). Sociale oplysninger (hvem og hvor mange venner du har, hvor meget du ligner dem og hvad din rolle i netværket er). Hvis det er uklart hvilke typer oplysniger Facebook trækker af stalden, er det endnu mere usikkert hvilke oplysniger der rent faktisk giver udslag, når et duplicate audience skal udpeges. Det er højst sandsynligt forskelligt fra annonce til annonce.

Enkeltfaktor forsvundet i høstakken
Måske ved ikke engang Facebook selv hvilke af de mange data det er, der gør udslaget. For med tilstrækkeligt mange variable til at tegne Big Data mønstret op, kan det være svært at spotte nålen i høstakken pege på præcis hvilken faktor der gør udslaget. Faktisk vil der ofte slet ikke være en enkelt let-forståelig årsag. Men det er heller ikke nødvendigt, sålænge du kender det rette mix. For det er i mix’en svaret ligger. Hvilket netop er et af de særligt smukke Big Data-kendetegn.

I den forstand er Facebook mere end summen af vores alle sammens aktiviteter. Måske endda “larger than life”.

Dette er det femte indlæg i min gennemgang af de syv bedste Big Data cases jeg kender. De første fire kan du finde her:

1. Target — supermarkedet der ved når du venter dig
2. Pas på, tyve i LA. Politiet ved hvor og hvornår I slår til næste gang
3. 23andme.com løser medicinske gåder med banebrydende Big Data-approach
4. Google — alle Store Data’s moder

--

--

Jon Lund
Jon Lund

Var: Konsulent, kommentator og foredragsholder. Alt digitalt. Er snart: Head of Online Communications, Danske Bank