L’efficacia del possesso

Matteo Pilotto
Published in
11 min readJan 9, 2019

--

Abbiamo analizzato le statistiche relative al possesso offensivo dei club europei per capirne il legame con i risultati del campo.

L’analisi di un fenomeno calcistico, che sia legato ad una singola partita o ad un trend tendenziale, porta a soffermarsi sugli eventi più iconici, caratterizzanti: gol segnati o subiti, occasioni concesse o create. Tutti questi non sono però altro che effetti, risultati di un insieme di variabili che intercorrono nel determinare un risultato, forniscono una finestra limitata su quelli che sono i perchè della partita.

Questo articolo è il primo di una serie in cui cercheremo le risposte ai perchè del campo analizzando la territorialità delle squadre dei cinque principali campionati europei, la loro capacità di invadere con continuità le zone prossime alla porta avversaria e di tenere l’avversario lontano dalla propria area, cercando di capire che cosa porta al verificarsi degli eventi che determinano l’esito di un match calcistico.

Per farlo, partiremo dall’analisi della Deep Completion (DC), una statistica che rappresenta il numero di passaggi che una squadra completa negli ultimi 18 metri di campo al netto dei cross. La useremo come strumento per capire e comparare gli atteggiamenti offensivi, ne investigheremo l’influenza sui risultati del campo e la correlazione con il numero di occasioni create, fino a misurare il peso del campionato di appartenza sui valori di DC registrati da una squadra.

Le migliori in Europa

Nel grafico qui sotto abbiamo incluso i dieci club europei con il maggior numero di passaggi completati, in media, negli ultimi 18 metri.
Spiccano, su tutti, i loghi di Manchester City e Bayern Monaco, le due squadre in Europa a viaggiare con la più alta DC media — rispettivamente pari a 14.38 e 13.06 a partita — e uniche capaci di tenere a distanza le inseguitrici Psg, Barcellona e Liverpool (tutte e tre a non meno di 3 punti dagli uomini di Guardiola).

Rispetto alla passata stagione, troviamo fuori dalle prime dieci il Real Madrid, il cui calo nel valore della DC — da 11.92 a 9 a partita — aiuta a spiegare il crollo negli expected goals (xG) generati (da 2.4 a 1.7). DC invece in crescita per la Juventus che non va tuttavia oltre il 23° posto. I suoi 7.37 passaggi completati negli ultimi 18 metri di campo sono soltanto poco più della metà rispetto a quelli del Manchester City.

DC a partita dei 98 club europei divisi per campionato, maggiore la DC e maggiore sarà il numero di passaggi realizzati negli ultimi 18 metri

Nello specifico, la Juventus crea effettivamente un numero di xG inferiore a quello dei cityzens (1.92 contro 2.46 a partita), ma rispetto agli uomini di Guardiola ha bisogno di un minor numero di passaggi negli ultimi 18 metri per rendersi pericolosa (3.83 contro 5.84). Allo stesso modo il PSG, terzo per DC (11.24), è la squadra in Europa a generare il maggior numero di xG a partita (2.61 contro i 2.46 del City).

Diversi stili offensivi o semplicemente diversa efficacia? L’obiettivo dell’analisi della DC è principalmente quello di interpretare modi e frequenza con cui una squadra si avvicina alla porta avversaria. Ci aiuta a capire il volume di gioco creato negli ultimi metri di campo, e, conseguentemente, a cogliere le ragioni per la maggior pericolosità di una squadra. Nei passaggi seguenti, invece, analizzeremo con maggior dettaglio la relazione tra Deep Completion e risultati sportivi.

Calcio Datato da oggi ha una nuova casa. Ogni settimana impacchetto analisi come questa e le faccio trovare gratuitamente nella tua inbox. Se vuoi evitare di perdertele, qui il link per iscriverti.

La Deep Completion varia in base a posizione e campionato

Nel grafico sottostante abbiamo diviso i club europei in 5 diverse fasce (o cluster) definite in base alla posizione in classifica. Utilizzeremo i valori della varianza¹ per capire se le squadre appartenenti alla stessa fascia siano caratterizzate da una simile capacità di palleggio offensivo: maggiore sarà il valore della varianza e maggiore sarà la variabilità della DC in quella fascia (nel grafico maggiore è la varianza e più distanti sono i simboli dei club dal valore medio).

Confrontando le diverse medie, appare evidente come la più forte differenza si presenti passando dalle squadre al momento tra le prime quattro nel proprio campionato — 8.17 DC in media — a quelle che stazionano tra la quinta ed ottava posizione — DC pari a 6.61 — con le ultime tre fasce (squadre dalla nona alla ventesima posizione) che presentano valori invece più vicini tra di loro — 4.62 per i club in quinta fascia, 4.59 per quelli in quarta e 5.35 per quelli tra il 9° ed il 12° posto — e le cui squadre di appartenenza mostrano una sostanziale omogeneità nei valori della DC.

Varianza e media della DC a partita per fascia dei club nei 5 principali campionati europei

Se la varianza all’interno delle ultime tre fasce oscilla tra l’1.03 della quinta e l’1.52 della terza, il 3.62 della seconda o ancor più l’8.09 tra le squadre dal primo al quarto posto mostrano come la differenza in termini di Deep Completion aumenti avvicinandosi alla vetta. È il risultato della presenza di club dai valori opposti — vedi Manchester City e Montpellier (DC pari a 4.59) — ma anche delle caratteristiche del campionato di appartenenza che nei grafici successivi si mostreranno come tutt’altro che omogenee.

Varianza e media della DC in Ligue 1 per fascia

La Ligue 1 è il campionato che presenta i valori più omogenei ma la cui stabilità viene rotta dall’alieno PSG, una singolarità che fa schizzare la varianza della prima fascia a 9.5, un valore significativamente più alto di quello delle altre fasce, nessuna va infatti oltre lo 0.55.
Premier League e Bundesliga — influenzate dagli outlier Manchester City e Bayern Monaco — presentano invece una situazione vicina a quella riscontrata a livello generale: varianza più alta tra le migliori quattro squadre (9.95 per la Bundesliga e 12.4 per la Premier e) e DC media che sale a gradini con il gap più evidente tra la prima fascia e le altre.

Varianza e media della DC per fascia in Premier League (a sx) ed in Bundesliga (a dx)

Il campionato italiano, rispetto alle altre leghe, mostra valori omogenei per le squadre nelle prime otto posizioni, con l’Atalanta — terza squadra in A per DC — a spostare la media della seconda fascia su valori più vicini a quella della prima, e con le squadre dalla nona alla ventesima posizione che registrano un forte distacco dalle altre, attestandosi su medie che vanno dai 5.29 passaggi della terza fascia ai 4.75 della quinta. Da segnalare l’anomalia Empoli, il cui sesto posto in Serie A per DC (7.58 passaggi a partita) si discosta fortemente dai valori di Chievo (4.58), Bologna (3.68) e Frosinone (3.26) ed incide in maniera decisiva sulla varianza tra le squadre di questa fascia: 3.79, la più alta in Serie A.

Varianza e media della DC per fascia in Serie A

In Liga, ad una generale consistenza nei valori di DC — varianza pari a 4.05 — si contrappone una scarsa omogeneità tra le squadre appartenenti alla stessa fascia. La presenza dell’Alaves tra le prime quattro — peggior squadra in Liga per numero di passaggi completati negli ultimi 18 metri — e del Real Madrid in seconda fascia, contribuiscono a ridurre il gap tra le prime quattro e le squadre dal quinto all’ottavo posto, oltre ad incidere negativamente sull’omogeneità all’interno delle singole fasce (varianza rispettivamente pari a 10.91 e 3.11). È un trend che verrà con buona probabilità invertito una volta che il Real Madrid sarà risalito in zona Champions, riportando così la seconda fascia su valori più prossimi a quelli della terza ed aumentando il divario tra le le prime quattro e le altre.

Varianza e media della DC per fascia in Liga

In Serie A, la DC è un buon indicatore della posizione in classifica

Qual è quindi la correlazione tra DC e i risultati di una squadra?
Abbiamo cercato la risposta attraverso l’analisi di una regressione lineare in cui la posizione in classifica rappresenta la variabile dipendente e la DC rappresenta la variabile indipendente. La necessità di lavorare su un campione sufficientemente largo ci ha portato ad includere nella nostra analisi anche le statistiche relative al 17/18, da qui il motivo della presenza nei grafici di due simboli per ogni club.

Il risultante R², o coefficiente di determinazione, ci fornisce una misura oggettiva sulla bontà della Deep Completion nello spiegare la posizione in classifica di una squadra. Maggiore l’R² — definito entro un range che va da 0 ad 1 — e maggiore sarà la porzione di cambiamento della variabile dipendente (in questo caso la posizione in campionato) spiegata dalla variabile indipendente (DC). Nel grafico, più vicini saranno i simboli dei club alla linea tendenziale e maggiore sarà il valore del coefficiente.

es. con la posizione in classifica come variabile dipendente e la DC variabile indipendente, un R²=0.8 significa che una variazione della DC spiega l’80% delle variazioni della posizione in classifica.

Correlazione tra DC e posizione in classifica nei cinque campionati europei con linea tendenziale

Se i risultati relativi a tutti e cinque i campionati europei mostrano una correlazione non sufficientemente forte — R² pari a 0.404 per la DC— da farci considerare la singola variabile come determinante nel definire la posizione di una squadra, spostando il livello di analisi sul singolo campionato la situazione cambia. La Serie A presenta infatti valori che si discostano da quelli generali oltre ad una forte correlazione tra DC e posizione in classifica confermata da un R² pari a 0.715 (osservabile nel grafico dalla vicinanza dei simboli del club alla linea tendenziale).

Tra gli altri campionati, è in Premier League che si riscontrano i migliori risultati. L’R² pari a 0.557 è indica una correlazione significativa tra numero di passaggi completati negli ultimi 18 metri e posizioni, sebbene non sia abbastanza elevato da rendere la DC un buon predittore delle variazioni nella classifica inglese. Risultati invece di poco inferiori a quelli generali in Liga, Bundesliga e Ligue 1, con un coefficiente di determinazione che va dallo 0.316 del campionato spagnolo allo 0.341 di quello tedesco (0.336 per la Ligue 1).

La DC è un ottimo predittore del numero di xG generati

Tolto il caso italiano, la Deep Completion si è dimostrata limitata nel spiegare, da sola, risultati e posizione di una squadra. Abbiamo quindi raffinato la nostra analisi concentrandoci sull’evento più prossimo alla misura utilizzata ed investigato la correlazione tra DC ed expected goals (xG).

Rispetto alla precedente analisi, dove l’allineamento dei simboli dei club risultava evidente soltanto per la Serie A, in questo caso il fenomeno è distribuito in tutte e cinque le leghe. In particolare, la correlazione tra xG e DC presenta valori di R² superiori a 0.7 per Bundesliga e Ligue 1 (0.706 e 0.753 rispettivamente) e superiori a 0.8 per le altre leghe: dallo 0.811 della Serie A allo 0.818 della Liga, per finire con lo 0.845 della Premier League, il campionato dove la Deep Completion meglio spiega il numero di expected goals.

Correlazione tra DC e xG descritta attraverso la linea tendenziale caratterizzante i cinque diversi campionati europei nele ultime due stagioni

Cosa possiamo trarre quindi da questa analisi? Qual è l’utilità della DC nell’interpretare il calcio moderno?

La Deep Completion si è dimostrata come un ottimo indicatore del numero di expected goals generato, mostrando un coefficiente di determinazione che testimonia come possa esere utilizzata per spiegare oltre il 70% delle variazioni in tutti e cinque i campionati. Al contrario, la realizzazione di un modello con una singola variabile indipendente si è rivelato troppo debole — all’infuori della Serie A — per poter predire la posizione in classifica di una squadra.

Le differenze riscontrate nel processo di analisi hanno portato alla luce l’importanza del campionato di appartenenza nel definire attitudini, stili di gioco ed abilità delle diverse squadre. La variazione degli scenari relativi alla DC e alla sua correlazione con posizione in classifica ed xG ha mostrato come un’analisi olistica dei cinque campionati sia possibile soltanto nel comparare singolarità e progressione nel tempo, risultando limitata rispetto ad uno studio concentrato sulla singola lega.

Clicca sull’immagine per accedere al grafico interattivo

Abbiamo raccolto le tematiche evidenziate nella nostra analisi in quattro punti che derscivono le specificità di ogni campionato studiato:

  • la DC fatica a spiegare le posizioni in classifica delle squadre della Liga ma si dimostra un miglior indicatore per quanto riguarda le occasioni create. L’attuale esclusione del Real Madrid dalla zona Champions rende le diverse fasce più omogenee, un trend destinato tuttavia a cambiare in futuro qualora le merengues salissero di posizione.
  • Premier League e Bundesliga sono i due campionati che presentano la maggior diversità in termini di attitudini al possesso. Una diversità tuttavia ben spiegata dalla Deep Completion, con il numero di passaggi completati negli ultimi 18 metri ottimo indicatore della capacità di una squadra di rendersi pericolosa. Entrambe le leghe presentano sostanziali differenze in DC tra le prime quattro e le altre.
  • In Ligue 1 l’omogeneità generale trova eccezione nei parametri di palleggio offensivo, dove i valori del Psg vanno ben oltre quelli delle altre 19 squadre incidendo sulla varianza tra i valori di DC delle prime quattro in classifica.
  • la Serie A risulta il campionato dove la DC possa essere meglio utilizzata per spiegare i risultati di una squadra grazie a una correlazione che permette di essere considerata come ottimo predittore della classifica del campionato. In particolare, la forte correlazione tra DC e xG dimostra come il numero di passaggi completati negli ultimi 18 metri sia un’ottimo indicatore della produzione offensiva di una squadra.
    L’eccezionalità del campionato italiano viene confermata dalla consistenza nei valori di DC tra le prime otto della classifica,uno scenario in contrasto con quello delle altre leghe dove il gap più ampio si presenta tra le prime quattro e le inseguitrici.

Analizzare valori ed evoluzione della DC permette di evidenziare congruenze o dissonanze rispetto ai principi di gioco degli allenatori, forza delle avversarie ed abilità nello sfruttare i punti deboli dell’altra squadra. Facilita la compresione degli eventi, guida nel racconto di una partita, di una stagione, e ci aiuta a trovare diverse risposte ai numerosi perchè del calcio giocato.

Sono stati utilizzati i valori relativi alla Deep Completion media, a partita, di ogni squadra.

¹ La varianza identifica la dispersione dei valori della variabile X attorno al valor medio. Tanto più piccola è la varianza, tanto più i valori di DC sono concentrati attorno al valor medio.

² L’R², o coefficiente di determinazione, è una proporzione tra la variabilità dei dati e la correttezza del modello statistico utilizzato. Esso misura la frazione della varianza della variabile dipendente espressa dalla regressione.

Dati Understat

--

--