Bot e risposta sul referendum

Noncommento ufficiale su “vicenda bot/algoritmi/M5S” pubblicata da La Stampa pubblicato sulla FB page di Valigia Blu

Project Gilda35
Gilda 35
Published in
5 min readNov 25, 2016

--

Updated: links a pié di pagina di articoli sulle politicalbots

Ripubblichiamo qui il ns. commento ufficiale alla vicenda e pubblicato il giorno X Y sulla Facebook Page ufficiale di Valigia Blu. Ripreso anche su Twitter da utenti che ne hanno proseguito la discussione.

In una galassia molto lontana prima che emergesse essere un semplice fake account della moglie di Brunetta (?).

Incipit

I nostri dati, pubblicati su Twitter, in relazione ai big data sulle conversazioni relative al Referendum non hanno alcuna relazione con quanto è oggetto nei vari articoli apparsi sulla stampa o sui blogs:

Tutto fila come al solito di questi tempi con pieni di 10101010101, quando sulla pagina di Facebook di Valigia Blu, sotto al post dove si commentava l’articolo di Valigia Blu sul caso dei “ghost ed esorciccibot” de La Stampa, un utente più dadaista del solito ci menziona scatenando un pim pum ciaff degno di piogge telematiche in pinete social!

Project Gilda35:

“Grazie Ruben Bianco per la citazione, dobbiamo ammettere che siamo molto colpiti di come questo argomento sia trattato come un fatto “nuovo”. Anche positivamente, poiché se la discussione si “stacca” dalla cronaca potrebbe insegnarci molto su come si leggono o calcolano i big data sui socials.

Proprio per riconoscere quei fenomeni che tentano di influenzarne l’analisi, da parte degli osservatori come dai media (i forensici che conosciamo bene sono più preparati sulle versioni criminali di botnets che sulla propaganda, da cui il linguaggio tecnico…). Oltre ai termini impropri usati, tipo “ghost” invece di “botivist”, per fare un esempio (cit. dal Manifesto dei Bot pubblicato dai ricercatori della Data & Society e dai centri di ricerca anglosassoni sulle #politicalbots). Persino lo sforzo dei riferimenti a “trame oscure/complotti”, probabilmente per esigenza di cronaca.

Ma che non descrivono in alcun modo la varietà di struttura e dinamiche degli sciami. In primis che uno sciame non ha un capo, semmai c’è chi può influenzarlo se ne ha la capacità e i mezzi.
In questo caso può fallire comunque (cit. caso Europee2014 vs Gilda35).

Per fare un piccolo passo in avanti, svincolandoci dalla cronaca, potrebbe essere utile ricordare che in altri paesi si osservano questi fenomeni almeno dal 2011 ma con test preparatori precedenti. Ovviamente in forma più sofisticata, con volumi notevoli rispetto ai timidi esempi nostrani. Dei quali vediamo un uso sistematico almeno dal 2013, con test preparatori precedenti.

Come dicevamo, numericamente non comparabili. A meno di loro errori nelle quantità prodotte o disorganizzazione tecnico/operativa (cit. caso Lettera43 dove Civati veniva dato oltre il 90% come vincitore delle #PrimariePD). E non tanto per il minor numero di utenti, rispetto ai paesi di lingua anglosassone o spagnola, ma semplicemente per la limitata AI dietro a TTT Italiani. Come in altre lingue più complesse da analizzare. Cosa che ha reso possibile influenzare le conversazioni in questi ultimi anni, anche con pochi accounts e poche conversazioni. Spesso con meno di 200 TWs.
Frequentemente il risultato è quello di dettare le agende delle conversazioni, dei bloggers e spesso anche dei mass-media.

Sulla difficoltà per i non addetti all’argomento va detto che la necessità di de-identificazione e dissimulazione degli swarm li spinge a diversificarsi nel tempo. A volte in pochi minuti (cit. #swarm sulla #Brexit in Uk trattato dal NYTimes e la Oxford University). Richiedendo sistemi di analisi specificatamente progettati e team articolati che vanno dalla statistica all’antropologia passando dalla psicologia cognitiva.

Perdonateci il breve pistolotto rivolto a coloro per cui @Gilda35 è solo un nickname privo di significato. Ma per farci perdonare vi segnaliamo il Twitter Moment sul caso #Referendum con i primi dati pubblicati: https://twitter.com/i/moments/800988776684290048.

Già dai primi dati, noterete che mentre ci si concentra sugli articoli relativi al caso citato da Valigia Blu in realtà, la fuori, si muovono molti “sciami”. Ed è passato inosservato proprio quello più facile da individuare che 1 anno fa colpì tutti i massmedia. Divenendo Prime News per oltre 24h: #AlfanoDimettiti e la botnet di Salvini.
Per gli interessati al tema, alcuni dei casi trattati nelle varie conferenze ed interviste radiofoniche sono relativi alle #PrimariePD, delle #Europee2014 e l’#AlfanoDimettiti già citato.
I numeri… sono solo numeri, Go dada!”

Valigia Blu, presa da un’indole surrealista a tratti pitagorica ci chiede: avete i dati ?

Project Gilda35:

“Noi raccogliamo direttamente i dati alla fonte, tutti. Poiché i big data non sono i dati raw, per questi fenomeni serve prima riconoscerli per comprendere come ricominciare con i raw e fare ricerca.

Iterando, verificando e validando. Questo a parte si. Abbiamo sempre i dati, anche se a solo supporto di una battuta comprensibile solo ai destinatari.

Sulla fonte anonima: conoscendo le dinamiche, specie all’estero, per quanto siano affidabili le fonti non possono essere l’elemento di valutazione. Per 2 motivi:
* Primo perché la fonte, anche se in buona fede, potrebbe avere dati pilotati o inquinati a sua insaputa. Tattica tra l’altro molto usata da chi è dietro agli sciami più resistenti.
* Secondo, in particolare per il post lungo precedente, non si può analizzare il fenomeno solo con una parte del campione dei dati altrimenti sarebbe come fare un sondaggio con intervistati solo di parte.
Perdonateci il paragone forzato: sarebbe come voler capire un film usando solo alcuni fotogrammi.”

La tensione si taglia con un trapano! E siccome si parla di social e di ciambelle così come l’alba è spuntata la fatidica domanda da parte di un utente: esistono servizi gratis e a pagamento che fanno queste cose “senza necessità di…”:

Project Gilda35:

“Una sola nota su cui non siamo d’accordo: NON esistono servizi web a pagamento o gratis per questo tipo di analisi. L’unico a pagamento è uno dei 6–7 “partner” di Twitter che però vende il servizio solo a forze dell’ordine. Ma poi servono sistemi di analisi sui dati raw ricevuti.

Oppure se si hanno le competenze e le risorse (calcolo, banda) si “ascolta” il flusso direttamente dal firehose di TW. O si compra lo stream raw da uno dei 5–6 partner di cui prima. I servizi citati nell’articolo sono quelli tipicamente utilizzati da SMM e Brand. Non si può fare forensica su quelli poiché privi dei metadati. Facilmente influenzabili (è per questo che le performance dadaiste funzionano, e che facciamo di tanto in tanto). Inoltre contengono errori impliciti, poiché privi della necessaria analisi di tipo dinamico che richiede iterazione sui dati stessi (ne sa qualcosa chi ha recensito il successo di #Sanremo, con dentro la performance dei ns. necro-tweet).”

Conclusioni

Stretta la foglia larga la via, se non vi è bastato tutto questo citazionismo che manco Tarantino, consultate dei tweet selezionati dalla cronologia (fa rima stacce!)

Riferimenti:
Repubblica, ”Salvini e l’esercito dei fan con il retweet automatico, giallo informatico su #alfanodimettiti”, LegaNordIllustrator botnet, 18/11/2015

BuzzFeed, “Italy’s Most Popular Political Party Is Leading Europe In Fake News And Kremlin Propaganda”, #politicalbots 29/11/2016

#Bigdata #Referendum #2016 pubblicati su Twitter

--

--

Project Gilda35
Gilda 35

If your life doesn’t make sense, go DaDa! The Official account of the satire cyber Dadaist Gilda35.com nonBLOG. ‘living in the TechnoCore since ever.