Print this page

Un dataset pubblico per studiare il calcio e analizzare le performance dei futuri campioni

Su 'Nature Scientific Data' una ricerca di Università di Pisa, ISTI-CNR e Wyscout/Hudl

È stato pubblicato su "Nature Scientific Data" (www.nature.com/articles/s41597-019-0247-7) il più grande dataset liberamente accessibile per fini di ricerca che permette di valutare le performance dei calciatori attraverso un algoritmo basato su Intelligenza Artificiale.

La ricerca - frutto della collaborazione, all'interno del progetto "SoBigData", tra l'Università di Pisa, l'Istituto di Scienza e Tecnologie dell'Informazione (ISTI) del CNR e l'azienda Wyscout/Hudl - ha consentito di rendere pubblici molti dati relativi al calcio. Nel dataset sono infatti riportati i dati della stagione 2017/18 dei cinque principali campionati nazionali dell'Europa (Francia, Germania, Inghilterra, Italia e Spagna), oltre alle ultime edizioni degli Europei 2016 e dei Mondiali 2018. Per tutte queste competizioni l’algoritmo PlayeRank, sviluppato dal già citato gruppo di ricercatori e recentemente pubblicato sulla rivista "ACM Transaction on Intelligent Systems and Technology", permette di analizzare e confrontare le performance di ogni calciatore, utilizzando tecniche di Intelligenza Artificiale per comprendere l’importanza di ogni singolo evento presente nei dati. In media sono stati registrati circa 1.700 eventi a partita, 60 per ogni singolo calciatore, che comprendono tocchi di palla, tiri, assist, passaggi di destro, sinistro e di testa, posizione di campo e così via. 

Pappalardo

"Attraverso l'algoritmo PlayeRank - spiega il dottor Luca Pappalardo (nella foto a lato), autore della ricerca insieme a Paolo Cintia, Alessio Rossi, Emanuele Massucco, Paolo Ferragina, Dino Pedreschi e Fosca Giannotti - riusciamo a valutare la bravura del singolo calciatore, compilando una 'pagella' basata su indicatori puramente oggettivi e non emozionali. Questo aiuta a individuare i talenti, soprattutto giovani, destinati con il tempo a esplodere e a veder aumentare esponenzialmente il proprio valore". Restando alla stagione 2017-2018 l'algoritmo ha evidenziato, tra i migliori under 23, calciatori arrivati alla fama internazionale quali Gabriel Jesus, allora alla sua prima stagione intera nel Manchester City, Leroy Sané, altro grande talento esploso nei Citizens, e, in relazione al campionato italiano, Patrick Cutrone, appena inserito in pianta stabile nella rosa del Milan.

"I dati sono potenzialmente in grado di evidenziare il valore di un calciatore in termini comparativi e di evidenziarne il trend di crescita, così come di approfondire il sistema tattico di gioco di una squadra - conclude il dottor Pappalardo - ma è chiaro che il risultato principale della pubblicazione sta nell'aver messo a disposizione della comunità che si occupa di sports analytics, per la prima volta e in modo così ampio, uno strumento open science unico nel suo genere su cui i ricercatori potranno liberamente confrontare metodi, obiettivi e risultati di analisi".

Anche il codice sorgente di PlayeRank è open source, disponibile su github insieme a un tutorial interattivo che mostra come acquisire il dataset pubblico e applicare, passo dopo passo, l’algoritmo di valutazione della performance.

Questo sito utilizza solo cookie tecnici, propri e di terze parti, per il corretto funzionamento delle pagine web e per il miglioramento dei servizi. Se vuoi saperne di più, consulta l'informativa