La pagella elettronica dei mondiali di Corea e Giappone: il modello IVG (fcamillo@stat.unibo.it) dipartimento di Scienze Statistiche dell Università di Bologna docente di Statistica e di Tecniche Statistiche per il monitoraggio della Clientela responsabile scientifico del progetto IVG responsabile scientifico di Il sommario da anni DSP predispone servizi per il monitoraggio statistico in tempo reale degli accadimenti di una partita di calcio ai mondiali oltre a una serie di statistiche descrittive dell andamento del match, ormai usuali nelle dirette Stream o nelle tv tematiche come Roma Channel Software specifici di telerilevazione delle partite e di georeferenziazione sul campo di tutti i gesti atletici (Digital Soccer Project ) il problema della codifica dei gesti tecnici è stato risolto nel corso di anni di collaborazione con I più importanti allenatori: Lucescu, Zeman, Ancelotti, Sacchi, Malesani e tanti altri. Tuttavia: il calcio è un gioco in cui entrano in ballo numerosi elementi assolutamente non ponderabili e difficilmente osservabili perché legati all'interazione che i vari gesti tecnici hanno fra loro, sia nell'ambito di giocatori della stessa squadra, sia perché condizionati a quelli della squadra avversaria; a differenza di molti altri sport il calcio vive di un fascino basato sulla rarità degli eventi determinanti, primo fra tutti il goal: capita molto raramente di assistere a partite con più di 4 o 5 goal. 1
Il sistema Digital Soccer I dati che il sistema messo a punto dalla Digital Soccer raccoglie per il singolo match sono organizzabili in un ipercubo a quattro dimensioni: 1) il giocatore che svolge l azione (con cardinalità pari a 22); 2) l azione svolta (le azioni tecnicamente codificate sono circa 150); 3) il minuto di gioco nel quale avviene il fatto; 4) la localizzazione del fatto tradotta in coordinate pixel televisive digitalizzate. Accanto a tale ipercubo esiste poi un insieme di dati descrittori degli oggetti dell ipercubo stesso, come ad esempio la squadra di appartenenza del giocatore, il suo ruolo oppure l intero sistema di codifica delle coordinate pixel della localizzazione dell azione. Dsp produce poi una serie di report per squadre e mass media La finale di Euro2000 Italia Francia: I flussi di gioco 2
IVG = i j ( x x ) ijk jk w con i = giocatore somma valore media j = azione pertinente svolta dal giocatore (colpo di testa, assist, intercettazione, ecc.) k = ruolo del giocatore la pagella è espressa in trentesimi, come all Università il valor medio dovrebbe rappresentare quanto di quello specifico gesto è lecito aspettarsi da un giocatore che ricopre quello specifico ruolo un allenatore per ogni partita e per ogni giocatore ha, forse inconsciamente, delle aspettative sui singoli e quindi una determinazione, già durante la preparazione dell incontro, di una certa performance attesa sia per la squadra che per i singoli calciatori è però difficile stimare prima della partita quanti sono, ad esempio, i passaggi filtranti attesi dal singolo giocatore in quella partita, oppure quanti gli assist o quante le intercettazioni a centrocampo o in difesa L IVG di Digital Soccer risolve in maniera automatica tale problema definendo come attesa quella performance che è in sintonia con la media storica del ruolo del singolo giocatore L IVG doveva però rispondere all esigenza di descrivere bene la probabilità di vittoria del singolo, dato il contesto di gioco jk Peso del gesto per quel ruolo L IVG agli europei... ma Inzaghi prese 29 contro la Turchia agli europei......facendo tanti recuperi di palla a centrocampo, quindi fu confrontato con una prima punta mentre era stato una seconda punta, vista la sua posizione media durante la partita 3
Oggi, ossia la seconda fase della ricerca Gli autoruoli sono state cercate da algoritmi di classificazione automatica le k configurazioni ragionevolmente esistenti fra tutte le densità di gioco dei calciatori così come hanno giocato nel campionato 2001-02 sono state trovate in maniera automatica da appositi test 11 configurazioni 4
Gli autoruoli 5
6
7
Gli automoduli sono state cercate da algoritmi di classificazione automatica le k configurazioni ragionevolmente esistenti fra tutte le densità di gioco delle squadre così come hanno giocato nel campionato 2001-02 sono state trovate in maniera automatica da appositi test 8 configurazioni le combinazioni possibili autoruolo/automodulo sono dunque 11*8=88 ulteriori calcoli hanno però consigliato la riorganizzazione degli 88 combinazioni in 16 classi di combinazioni autoruolo/automodulo: le autodefinizioni 8
Il modello oggi Pr i,j elemento di s (v/s)=f [(X i ); (X j )] + e ij componente individuale componente di squadra la probabilità di vittoria del singolo è funzione del suo rendimento e di quello della squadra (il contesto), più una componente casuale e ij (ipotizzata mediamente nulla) una volta stimata la funzione (i pesi degli indicatori), il contributo del singolo alla probabilità di vittoria complessiva diviene il suo indice di rendimento l idea è: quale sarebbe stata la probabilità di vittoria del singolo se la sua prestazione specifica fosse stata espressa in una squadra (il contesto) dal rendimento medio? (per quell automodulo e quell autoruolo specifici) Lo staff di attuazione Il progetto si è articolato con l impegno scientifico del Dipartimento di Scienze Statistiche (prof. ) Digital Soccer Rai Trade SAS fornitore ufficiale del software di elaborazione di tutte le statistiche dei mondiali Simbologica (Stefano Sforza) che ha realizzato il software in linguaggio SAS 9
Bologna Giocatore Presenze IVG medio CRUZ JULIO RICARDO 33 22.32 PAGLIUCA GIANLUCA 34 21.50 OLIVE RENATO 28 21.50 FRESI SALVATORE 25 20.80 SIGNORI GIUSEPPE 14 20.18 ZAULI LAMBERTO 27 19.30 ZACCARDO CRISTIAN 19 18.90 FIRMANI FABIO 5 18.89 TARANTINO MASSIMO 23 18.87 PECCHIA FABIO 33 18.69 NERVO CARLO 29 18.65 GAMBERINI ALESSANDRO 14 18.16 FALCONE GIULIO 32 18.00 MACELLARI FABIO 10 17.81 WOME NLEND PIERRE 13 17.73 LOCATELLI TOMAS 2 17.70 NEGRI MARCO 2 17.08 Possibili sviluppi e usi Monitoraggio in tempo reale in panchina per gli allenatori Base per la costruzione di indici di valutazione economica del giocatore legati al rendimento domenica dopo domenica 10