Negli ultimi anni i modelli di expected goals (xG) si sono affermati come strumenti centrali nell’analisi calcistica, stimando la probabilità che un tiro si trasformi in gol sulla base delle sue caratteristiche geometriche. Nonostante la loro diffusione, la maggior parte delle applicazioni adotta una prospettiva centrata esclusivamente sul tiratore, trascurando il portiere come agente attivo dell’azione. Questa tesi si propone di colmare tale lacuna sviluppando un modello predittivo della probabilità di segnare nelle situazioni di uno contro uno (1-vs-1), integrando nel framework pre-shot informazioni esplicite sulla posizione e sul comportamento del portiere. A partire da dati di StatsBomb Open Data, viene implementato un esteso processo di feature engineering che ha permesso lo sviluppo di variabili geometriche e posizionali interpretabili e a una classificazione data-driven degli stili di intervento. L’analisi valuta anzitutto in che misura l’inclusione delle informazioni sul portiere incrementi la capacità predittiva dei modelli xG, e successivamente confronta tre algoritmi – regressione logistica, Random Forest e XGBoost – come strumenti alternativi di stima. I risultati mostrano in modo consistente che le variabili posizionali del portiere rappresentano un determinante fondamentale dell’esito dell’azione: la loro inclusione produce un aumento netto della capacità discriminante in tutti gli algoritmi. Le variabili comportamentali apportano anch’esse un contributo predittivo, sebbene più contenuto rispetto alle variabili posizionali. Il GLM emerge come modello particolarmente robusto: fornisce probabilità ben calibrate e, in termini prognostici, offre performance comparabili – e talvolta superiori – rispetto agli algoritmi più complessi. Sul piano metodologico, il lavoro dimostra come sia possibile estendere la modellazione xG utilizzando esclusivamente dati open-source, integrando la dimensione difensiva senza ricorrere a dati di tracking. Sul piano applicativo, i risultati offrono strumenti quantitativi utili per lo scouting dei portieri, l’analisi della performance e la preparazione tecnico-tattica, mostrando come il portiere rappresenti una componente essenziale della qualità dell’occasione negli 1-vs-1.

Prevedere la probabilità di gol nelle situazioni di 1-vs-1: il ruolo delle caratteristiche del portiere

PALTRINIERI, ANNA
2024/2025

Abstract

Negli ultimi anni i modelli di expected goals (xG) si sono affermati come strumenti centrali nell’analisi calcistica, stimando la probabilità che un tiro si trasformi in gol sulla base delle sue caratteristiche geometriche. Nonostante la loro diffusione, la maggior parte delle applicazioni adotta una prospettiva centrata esclusivamente sul tiratore, trascurando il portiere come agente attivo dell’azione. Questa tesi si propone di colmare tale lacuna sviluppando un modello predittivo della probabilità di segnare nelle situazioni di uno contro uno (1-vs-1), integrando nel framework pre-shot informazioni esplicite sulla posizione e sul comportamento del portiere. A partire da dati di StatsBomb Open Data, viene implementato un esteso processo di feature engineering che ha permesso lo sviluppo di variabili geometriche e posizionali interpretabili e a una classificazione data-driven degli stili di intervento. L’analisi valuta anzitutto in che misura l’inclusione delle informazioni sul portiere incrementi la capacità predittiva dei modelli xG, e successivamente confronta tre algoritmi – regressione logistica, Random Forest e XGBoost – come strumenti alternativi di stima. I risultati mostrano in modo consistente che le variabili posizionali del portiere rappresentano un determinante fondamentale dell’esito dell’azione: la loro inclusione produce un aumento netto della capacità discriminante in tutti gli algoritmi. Le variabili comportamentali apportano anch’esse un contributo predittivo, sebbene più contenuto rispetto alle variabili posizionali. Il GLM emerge come modello particolarmente robusto: fornisce probabilità ben calibrate e, in termini prognostici, offre performance comparabili – e talvolta superiori – rispetto agli algoritmi più complessi. Sul piano metodologico, il lavoro dimostra come sia possibile estendere la modellazione xG utilizzando esclusivamente dati open-source, integrando la dimensione difensiva senza ricorrere a dati di tracking. Sul piano applicativo, i risultati offrono strumenti quantitativi utili per lo scouting dei portieri, l’analisi della performance e la preparazione tecnico-tattica, mostrando come il portiere rappresenti una componente essenziale della qualità dell’occasione negli 1-vs-1.
2024
Expected Goals
Algoritmi predittivi
Portiere
Analisi calcistica
Modelli statistici
File in questo prodotto:
File Dimensione Formato  
Paltrinieri.Anna.Tesi.pdf

Accesso riservato

Dimensione 3.65 MB
Formato Adobe PDF
3.65 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/4339