Giocare con i numeri, Google e i social media: perché martedì Donald Trump potrebbe essere il 45° Presidente degli USA

Tante, forse troppe, parole e qualche dato utile.

Premessa

Una previsione dei risultati di un’elezione è per definizione qualcosa di estremamente difficile. Una previsione attendibile non deve tener conto semplicemente delle rilevazioni numeriche dei sondaggi d’opinione effettuati utilizzando le più svariate metodologie ma essere in grado di considerare l’incidenza di fattori storici, sociali ed economici ed inserirli, come fattore matematico, nella formula di calcolo senza tralasciare vari fattori di tipo “personale” o “psicologico” degli elettori.

Esiste sempre il concreto rischio di non considerare o sottostimare fattori essenziali che influiranno in maniera sostanziale sulle decisioni di voto degli elettori che magari li considereranno solo il giorno delle elezioni. Per questo esiste il silenzio elettorale, o sarebbe meglio dire “esisteva” perché oggi con la disponibilità diffusa di mezzi di comunicazione è possibile comunque cercare di influenzare l’elettore durante l’ ”ultimo miglio”, magari creando e “alimentando”, il giorno prima del voto, un hashtag su un argomento specifico che si sa essere particolarmente favorevole ad un candidato.

I dati di questo scritto sono stati tratti da fonti considerate attendibili e comunemente utilizzate in casi analoghi. Inoltre sono stati utilizzati solo dati disponibili gratuitamente in rete.

Per essere chiari, il testo a seguire non pretende, non vuole e non deve essere ritenuto scientifico o attendibile ma rappresenta unicamente il tentativo di dipanare un ragionamento sulla base di dati comunemente reperibili su internet. La complessità degli argomenti e l’imminenza dell’evento non hanno permesso di approfondire alcuni particolari argomenti e si è cercato di sopperire a ciò condividendo, il più possibile, le fonti e tralasciando di dedicare paragrafi nella spiegazione di alcuni concetti (quale ad esempio la sentiment analysis) che si ritengono conosciuti da chi ha la pazienza di leggere questo testo.

Gli elementi di partenza del quadro complessivo

La tesi di fondo

L’assunto di partenza dell’analisi è l’esistenza di un rapporto diretto tra il numero di tweet generati in occasione di una competizione elettorale su un candidato o un partito e i risultati effettivamente conseguiti, come dimostrato empiricamente nell’articolo “The mere number of tweets reflects voter preferences and comes close to traditional election polls.” curata dalla Technical University of Munich

Fattori da considerare:

  • Gli effetti negativi degli scandali sul voto

La campagna elettorale è stata costellata, come prevedibile considerati le storie personali dei due contendenti, di vari scandali che sono emersi, probabilmente non a caso, in specifici momenti chiave della competizione elettorale.

Giusto per ricordarne alcuni, si pensi all’utilizzo di server privati, non protetti, da parte della Clinton quando era Segretario di Stato o il riemergere di illazioni sui precedenti extraconuiugali di suo marito. Mentre, per quanto riguarda Trump, si è posta particolare attenzione sulle modalità di pagamento delle tasse da parte del magnate, sulla sua condotta nei confronti delle donne e sull’attività di lavoro della moglie quando ancora non possedeva un visto di soggiorno che lo permettesse.

Se si esamina il modo in cui i candidati hanno gestito gli “scandali” si ritiene che Trump sia riuscito a limitarne i danni, gestendoli e facendo in modo che, almeno in parte, apparissero comunque coerenti con l’immagine che desiderava dare agli elettori.

Elaborazione su dati da: http://bit.ly/2ful79E
  • La salute fisica dei candidati

Non si ricorda un’elezione presidenziale in cui si è dibattuto così tanto della salute dei candidati. La non giovane età di entrambi, la riservatezza della Clinton nel rendere noto il proprio quadro generale di salute e l’incidente dello svenimento della candidata democratica hanno reso rilevante il “fattore salute” che al momento del voto peserà in parte sulle scelte.

Nonostante gli sforzi di entrambi i contendenti, Trump apparirebbe aver gestito meglio questo fattore e risulterebbe uscirne avvantaggiato rispetto alla Clinton.

  • Le previsioni dell’Huffington Post

Come dato “tradizionale”, derivante da un sistema misto di sondaggi, sono state prese in considerazione le proiezioni pubblicate dell’Huffington Post statunitense.

Le proiezioni messe a disposizione dall’HP sono interessanti per ricchezza di dati, grafici e immediatezza nel comprendere il quadro della situazione Stato per Stato.

L’elettorato statunitense: fattore età e incidenza sul voto degli elettori attivi sui social media

Se si analizza il numero dei cittadini statunitensi che utilizza uno o più social media, si osserva che circa 92 milioni di essi hanno meno di 44 anni.

Da: www.statista.com

Di conseguenza è possibile affermare che la fascia di persone con meno di 44 anni incide per il 61% sul totale dei cittadini statunitensi che utilizzano i social media che, da questi dati, appare essere di ca. 151 milioni.

Va poi considerato che la percentuale dei cittadini statunitensi che oggi possiede un profilo su un social media è pari a ca. 253,5 milioni, ovvero al 78% dell’intera popolazione americana che, ad oggi, è stimata essere di ca. 325 milioni.

Da: www.statista.com

Questo dato è destinato a ridimensionarsi quando si rileva che il numero degli utilizzatori (profili attivi) negli USA è fisiologicamente minore (ca. 196 milioni nel 2016) rispetto al numero di coloro che hanno un profilo social media.

Da: www.statista.com

Riassumendo i dati sopra citati si rileva un conflitto, proveniente dalla stessa fonte, relativamente al numero dei profili attivi sui social media con un dato che oscillerebbe tra i 151 e i 196 milioni ovvero tra il 46,5% e il 60.3% della popolazione americana.

Questa differenza di dati potrebbe essere dovuta da diversi fattori quali, ad esempio:

  • un’errata stima del tasso di crescita della popolazione statunitense
  • una differenza temporale nella rilevazione dei dati riportati nei grafici
  • una diversa accezione dell’espressione “social network user” nell’elaborazione dei due grafici

In ogni caso, nel proseguimento di questa analisi, in via prudenziale, si prenderà in considerazione un’incidenza del 46,5% di utilizzatori attivi dei social media rispetto al totale della popolazione americana.

Va infine osservato che l’età anagrafica dei votanti alle presidenziali indica una partecipazione tra il 40% e il 56% tra gli aventi diritto al di sotto dei 44 anni nelle ultime tre tornate elettorali.

Fonte: http://www.electproject.org/home/voter-turnout/demographics

Questo fattore è particolarmente interessante perché è proprio in questa fascia di età che si riscontra un maggiore utilizzo dei social media ed è quindi presumibile affermare che le previsioni del risultato elettorale basate sull’utilizzo dei social media e di altri fattori legati al web (Google Search, Sentiment Analysis, YouTube, ecc..) potrebbe essere attendibile in quanto riguarda un campione di elettori superiore al 50%.

Fattori sociali e psicologici relativi all’utilizzo dei social media

Se si considera che il linguaggio non si estrinseca unicamente in forma verbale e che nel corso di un comune dialogo con una persona si è portati ad analizzare, più o meno consciamente, le sue reazioni non verbali, si comprende perché i social media rappresentano, almeno in determinate circostanze (assenza di timore di essere tracciato, utilizzo di un nickname, ecc…), un mezzo di espressione delle proprie opinioni estremamente “libero” rispetto alle altre forme di interazione umana.

Si consideri inoltre che la sola presenza fisica di uno o più interlocutori può inevitabilmente mediare o condizionare il livello di sincerità nelle risposte. Lo stesso avviene, in forma meno accentuata, durante una conversazione (nel caso specifico un sondaggio) telefonica dove, pur non essendoci presenza fisica dell’interlocutore, si è “inconsciamente” condizionati, ad esempio, dal tono della voce dell’interlocutore, dalle sue pause, ecc..

Va inoltre tenuto conto che la percezione della propria presenza/essenza in rete quale singolo individuo, anche all’interno di un social media, è quella tipica dei grandi gruppi ovvero mediata, in maniera direttamente proporzionale, dall’ampiezza del gruppo stesso. Più è grande il gruppo a cui si appartiene meno ci si sentirà “oggetto” di attenzione da parte degli altri membri e quindi si tenderà ad esprimersi in maniera più libera e sincera.

Da un punto di vista “politico”, una persona che appartenga ad un partito o a un movimento, difficilmente condivide in toto le idee espresse dai suoi rappresentanti/candidati in quanto questi ultimi tendono normalmente ad esprimere la sintesi delle opinioni maggioritarie dell’elettorato di riferimento. Per quanto espresso poco più sopra, è possibile affermare di conseguenza che si avrà meno difficoltà ad esprimere il proprio parere favorevole ad un’idea radicale, espressa da un partito o movimento notoriamente schierato in posizione opposta a quello di appartenenza, quando si utilizza un social media. Ciò in quanto l’”anonimato” offerto dal social media permette all’individuo/elettore di non incappare in eventuali commenti negativi degli altri membri del partito/movimento lasciandolo quindi libero di esprimersi “liberamente” su argomenti anche spinosi.

Nel caso specifico, è possibile che le molteplici affermazioni politically uncorrect del candidato Donald Trump, ricevano un inaspettato numero di reazioni positive maggiori sui social media proprio perché, utilizzando questi canali, gli utenti ritengono di avere una maggiore libertà di espressione con la garanzia di anonimato.

Analisi del sentiment relativi a Trump e Clinton

L’analisi dei Twitter relativi ai due candidati presenta una particolarità: Hillary Clinton, al contrario di quello che ci si aspetterebbe, ha un sentiment più negativo di quello di Trump.

I grafici che seguono mostrano, prima per Trump e poi per la Clinton, i dati relativi al sentiment espresso dalla rete sui due candidati, cercando di coglierne non solo l’andamento temporale ma anche, soprattutto, il rapporto tra sentiment positivo e negativo di ognuno dei contendenti.

  • Sentiment relativo a Trump
Sentiment in the most recent period http://opinioncrawl.com/blog/Donald-Trump
Fonte: http://opinioncrawl.com/
Fonte: http://opinioncrawl.com/
  • Sentiment relativo a Clinton
Sentiment relativo a Clinton
Sentiment relativo a Clinton
Sentiment relativo a Clinton

Al di là dei dati sull’andamento storico, che sono comunque utili se si effettua una relazione con il parallelo sviluppo di notizie scandalistiche riferibili ai candidati, appare, a prima vista, interessante rilevare un sentiment negativo predominante riferibile anche alla Clinton.

La differenza finale tra i due sentiment, che sarà utilizzata come elemento di calcolo, è di ca. 0,15 a sfavore di Trump.

  • Analisi delle “parole chiave” associate a Clinton e Trump

Da ultimo, non solo a fini semantici, risulta anche importante notare come le “parole chiave” di ricerca o citazione sul web legate alla Clinton comprendono quelle relative a Bernie Sanders, suo principale rivale democratico durante le primarie mentre, a sorpresa per chi scrive, non sono presenti termini relativi al “machismo” di Trump nella lista a lui riferita.

Clinton — da opinioncrawl.com
Trump — da opinioncrawl.com

Altri fattori a favore di Trump o della Clinton

  • Il sostegno familiare

Se si esamina la presenza complessiva sui social media della famiglia Trump si osserva che il sostegno apportato alla candidatura di Donald Trump da parte della moglie e delle figlie è stato di gran lunga più incisivo di quanto fatto da Bill Clinton e dalla figlia Chelsea.

Si consideri, ad esempio, che secondo socialbakers.com, la sola Ivanka Trump registra sui social media un incremento di fan settimanale pari a 11.000 e mensile di ca. 69.000.

Le tematiche affrontate e il sostegno dato a livello famigliare dai Trump nel corso di tutta la campagna è stato chiaro, netto e sembrerebbe essere riuscito nel trasmettere un’immagine di famiglia moderna ma “tradizionale” basata su una solida armonia interpersonale. Il clan Clinton, dal canto suo, è apparso molto più offuscato con un Bill Clinton che, nonostante i discorsi ufficiali di sostegno alla moglie, non sembrerebbe essere riuscito ad essere così incisivo come ci si sarebbe potutto attendere.

  • La radicalizzazione delle tematiche

La paura della radicalizzazione della politica interna ed estera, qualora vincesse Trump, è certamente un fattore che potrebbe influenzare le decisioni di voto a favore della Clinton anche se, su questo aspetto, esaminando le reazioni dei cittadini sul web e gli articoli della stampa, la Clinton non sembrerebbe aver conseguito un beneficio particolare.

Inoltre, almeno negli ultimi mesi della sua campagna la candidata democratica ha, a sua volta, scommesso sul desiderio di “certezza” dell’elettore medio statunitense costruendosi un’immagine di leader “forte”, deciso nelle scelte e abbracciando alcune posizioni “radicali” rispetto ai desiderata dell’elettorato. Questo atteggiamento della Clinton potrebbe aver rafforzato parte dei voti dei democratici poco entusiasti della sua candidatura ovvero i sostenitori di Sanders nella campagna per le primarie. Di contro, la parziale radicalizzazione delle tesi politiche della Clinton potrebbe aver convinto parte dei cosiddetti “indecisi” a votare in favore di Trump per contrastare idee ritenute foriere di futuri aumenti della tassazione a livello federale.

  • Barnie Sanders vs. Disconoscimento leader Repubblicani

Quanto inciderà la frattura creatasi all’interno del partito democratico al momento delle primarie non è facilmente quantificabile dal momento che Barnie Sanders ha ufficialmente e concretamente invitato i propri elettori a votare in favore della Clinton. Va però rilevato che l’endorsment di Sanders potrebbe non aver convinto tutti i suoi sostenitori e c’è la possibilità che parte dei voti dei democratici vadano dispersi o comunque non siano esplicitati correttamente il giorno delle elezioni.

Da parte sua, Trump sconta la sua “terzeità” rispetto all’establishment del partito repubblicano e il conseguente non “ottimale” supporto fornitogli dai membri più in vista del partito, senza ovviamente tralasciare il disconoscimento fatto da alcuni leader e il tentativo, in extremis, da parte del suo stesso partito, di ritirare l’investitura quale candidato alle presidenziali.

In ogni caso, la non appartenenza di Trump alla nomenklatura del partito repubblicano, potrebbe aver attirato le simpatie di un segmento dell’ala “radicale”, compensando in parte la problematica sopra esposta.

Questi fattori negativi, in conclusione, sembrerebbero essere quasi completamente compensati tra i due candidati anche se la Clinton potrebbe risultare leggermente più svantaggiata rispetto al rivale repubblicano.

  • Gli elettori dell’ultimo minuto — “How to vote for..”

Nel sistema statunitense il diritto al voto può essere esercitato da coloro che sono iscritti nelle liste elettorali. L’iscrizione non è automatica in base ai dati anagrafici e di residenza ma è richiesta l’iscrizione del cittadino che è tenuto a seguire una specifica procedura (variabile da Stato a Stato) per poter esercitare il diritto al voto.

Secondo i dati disponibili, al momento, Trump è in testa se si considera il numero di ricerche con le parole chiave “Come votare per Trump” e il relativo andamento nell’ultimo mese, riportati nel grafico qui sotto.

Da: http://bit.ly/2fpZo2J

Tale dato risulterebbe confermato anche dall’analisi di Google Search, secondo cui la tendenza delle ricerche effettuate sull’omonimo motore di ricerca vedrebbe un costante vantaggio nelle ricerche aventi ad oggetto Trump.

https://googletrends.github.io/search-election-realtime/
  • Analisi dei video YouTube visti nel mese di ottobre 2016
Da: https://googletrends.github.io/youtube-election-real-time/

Gli ultimi dati sulle ricerche effettuate su YouTube.com lasciano invece intravedere un certo vantaggio della Clinton le cui visualizzazioni di video a lei dedicati sono rappresentati, nel grafico sopra, con i colori tra l’azzurro e il blu a secondo del numero di “click”.

I dati relativi al numero di Tweet

Questo è il dato cardine di questa (personalissima) analisi e sinceramente lascia perplessi se si considera che il numero dei Tweet (espressi in percentuale) riferibili a Donald Trump è superiore a quello della Clinton in tutti gli Stati tranne Montana, North Dakota, Oregon, South Dakota e West Virginia.

Va evidenziato che nel corso dell’analisi si è deciso di sommare ai Tweet di Hillary Clinton anche quelli ascrivibili a Sanders considerandoli espressione dello stesso partito.

Da: https://interactive.twitter.com/candidateRace16/?status=active&metric=proportion

Secondo quanto in precedenza descritto sull’assunto della Technical University of Munich circa l’ipotetica correlazione tra numero di Tweet e i risultati elettorali, sembrerebbe quindi possibile la vittoria di Donald Trump.


La funzione matematica alla base dell’analisi finale

Il divertissement è stato quello di cercare di dare una logica a tutti i fattori e i dati sopra descritti e di concatenarli in una funzione che potesse rappresentare al meglio un possibile scenario reale dei risultati elettorali.

Per fare ciò sono state introdotte, specialmente relativamente ad alcuni fattori, delle valutazioni di incidenza calcolate su base personale, non volendo pretendere alcuna scientificità a questo scritto.

La possibilità di errore è forte ma alla fine dell’analisi, considerando che quanto descritto è in definitiva un game (nell’accezione americana “nobile” del termine), si è giunti a dei risultati che si è deciso comunque di condividere qui sotto:

https://galigio.org/

Il risultato finale, secondo la funzione elaborata in base ai fattori, in positivo e in negativo, sopra descritti, vede la vittoria di Donald Trump con 316 grandi elettori contro i 222 di Hillary Clinton.

https://galigio.org/
Immagine originale da http://bit.ly/2fywFc4 — Modificata da https://galigio.org/ con i dati qui presenti — Stati ipoteticamente a favore di Clinton in blu — Stati ipoteticamente a favore di Trump in rosso

Conclusioni

La campagna elettorale di Donald Trump, qualsiasi sarà l’esito reale del voto, è stata un ottimo esempio di moderna strategia politica. L’utilizzo del web e dei social media come strumento di campagna elettorale non è stato semplicemente basato sulle quantità ma è stato ben orchestrato anche a livello familiare con un’ottima scelta delle tematiche rispetto ai tempi della campagna elettorale e al momento in cui sono emersi gli scandali dell’avversario.

Anche se Trump non dovesse vincere, la sua campagna è stato un chiaro esempio di come si possa rimontare una situazione elettorale data per persa, attraverso un uso sapiente dei social media trasformandoli da strumento di supporto a fattore chiave della strategia per le presidenziali USA.

L’”effetto Twitter” citato come assunto di partenza di questo scritto, è stato in parte mitigato e/o rafforzato dai molteplici altri fattori descritti oltre che dal sistema elettorale federale statunitense che permette ai candidati di concentrarsi selettivamente sugli Stati dove l’espressione di voto dei cittadini appare più incerta, tralasciando altri Stati dove il risultato appare essere di gran lunga più favorevole per l’avversario.

In conclusione, una cosa è certa: questa tornata elettorale per le presidenziali USA segna un punto di svolta sull’utilizzo del web e dei social media come strumento decisivo per il conseguimento dell’elezione a Presidente e il quadro tracciato lascierebbe pensare che da ora in poi potrebbe essere possibile una situazione di “campagna presidenziale continua” in modo che i due maggiori partiti statunitensi possano costituire costantemente i presupposti base, a livello di social media, per veder prevalere il propprio candidato nel 2020.


Link utili:

“The mere number of tweets reflects voter preferences and comes close to traditional election polls.” by the Technical University of Munich

http://www.socialmediatoday.com/technology-data/using-social-media-data-predict-2016-us-presidential-election

http://www.themarketingfreaks.com/social-tools/ | Social Tools: 37 Strumenti per il Social Media Marketing

http://www.opinioncrawl.com/ | Opinion Crawl — sentiment analysis tool for the Web and social media

https://www.google.com/trends/story/election2016 | ‪‪Elections in Search 2016‬‬ — Google Trends

https://googletrends.github.io/search-election-realtime/

https://app.buzzsumo.com/research/most-shared?type=articles&result_type=total&num_days=7&general_article&infographic&video&guest_post&giveaway&interview&q=Trump&page=1 | Trump — Most Shared Content

https://www.iprospect.com/en/ca/blog/10-sentiment-analysis-tools-track-social-marketing-success/ | 10 Sentiment Analysis Tools to Track Social Marketing Success | iProspect

http://www.huffingtonpost.com/entry/americans-sick-of-the-election_us_58109da6e4b08582f88ce26c?section=us_politics | HUFFPOLLSTER: Social Media Users Are Sick Of Arguing About The Election | Huffington Post

http://elections.huffingtonpost.com/2016/forecast/president | 2016 President Forecast

http://www.zerohedge.com/news/2016-11-05/most-voters-now-think-clinton-broke-law?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+zerohedge%2Ffeed+%28zero+hedge+-+on+a+long+enough+timeline%2C+the+survival+rate+for+everyone+drops+to+zero%29

https://ecpr.eu/Filestore/PaperProposal/1b831ce3-696c-4988-830b-2c29c27c0237.pdf | 1b831ce3–696c-4988–830b-2c29c27c0237.pdf

https://interactive.twitter.com/candidateRace16/?status=active&metric=proportion