Un’altra giornata del campionato di calcio è giunta al termine e sicuramente molti di voi avranno perso l’ennesima schedina solo per “quella” sfortunata partita rinunciando ai grandi progetti di vacanza, all’anello per vostra moglie, allo smartphone o al televisore nuovo che avreste acquistato in caso di vittoria.

 

Ma cosa c’è dietro una partita e soprattutto cosa c’è dietro al pronosticarne l’esito?

Tipicamente per pronosticare l’esito di un evento quello che si fa e’ capire le squadre con le quali abbiamo a che fare: Sono squadre “forti” o sono squadre “deboli”? Hanno dei bomber? Quante partite vincono in casa e fuori casa? Giocano soltanto il campionato o anche altre competizioni europee? Hanno subito un cambiamento di rosa rispetto all’anno scorso? L’allenatore è sempre lo stesso? Qual è l’età media dei giocatori? Quali sono i risultati degli ultimi anni per lo stesso incontro? Quali sono previsioni meteo della partita?

Per un appassionato di calcio queste domande sono all’ordine del giorno quando cerca di pronosticare l’esito di un incontro di calcio. Ovviamente però questo ragionamento ha i suoi limiti. Oltre che i dati statistici di un qualsiasi giornale sportivo (o la raccolta di questi negli anni)  è quasi impossibile per un essere umano elaborare una tale quantità di informazioni per pronosticare un risultato, anche di un solo match.

Supponiamo di avere i dati delle ultime 500 giornate di campionato e di avere i dati statistici di tutti i giocatori e delle squadre che prenderanno parte ad una partita della quale vorremmo pronosticarne l’esito. Riuscireste mai ad elaborare questo quantitativo di dati per pronosticarne l’esito?

Se la risposta è si vi preghiamo di darci delle dritte per il prossimo weekend, mentre se verosimilmente la risposta è negativa abbiamo la soluzione per voi.

 

Machine Learning ed Intelligenza Artificiale applicata al Calcio

Il tipo di problema che abbiamo descritto sopra è uno tra i più classici problemi di intelligenza artificiale esistenti fin dalla nascita del machine learning come vi abbiamo spiegato in questo articolo.

In particolare il problema risiede nell’acquisire informazioni e riuscire a capirne il nesso relativamente ad uno scopo ben preciso. In questo caso le informazioni sono i dati che abbiamo sui giocatori e sulle squadre e lo scopo è quello di pronosticare l’esito di un match. Una rete neurale riesce a macinare centinaia di migliaia di informazione con una velocità molto maggiore (nanosecondi di un chip di silicio contro i millisecondi delle connessioni neurali biologiche) di quanto possa fare il nostro cervello e si dedica solo allo scopo per il quale è stata progettata.

Fornendo dei dati ad una rete neurale potremmo poter prevedere un’infinità di eventi come numero di gol, squadra vincitrice, numero di falli e molto altro. Ovviamente il caso ed il fattore umano è da tenere sempre in considerazione, ma generalmente potremmo assistere a dei risultati strabilianti.

 

Ma perché fermarsi a pronosticare gli eventi?

Sicuramente pronosticare gli eventi potrebbe essere un risultato importante per molti, ma le applicazioni nel mondo del calcio non si fermano ai soli scopi ludici o speculativi e le società di calcio hanno iniziato ad investire milioni di euro su Big Data e Machine Learning. Qualche esempio?

A Pisa, sede di Internet Festival, Cnr-Isti e Unipi hanno sviluppato, in collaborazione con FC Barcellona, un algoritmo per la previsione degli infortuni, combinando il potere dell’Internet of Things con quello dell’intelligenza artificiale: lo studio è pubblicato su PLoS One tramite un algoritmo basato sul machine learning si e’ riuscito a prevedere con una buona precisione la probabilita’ di infortunio di un giocatore basandosi su più di 40 parametri che i giocatori hanno fornito tramite dei sensori di monitoraggio.

“Tramite l’algoritmo si sono riusciti a pronosticare piu’ del 50% degli infortuni fornendo un risultato ben preciso: se le societa’ si fossero affidate all’algoritmo in più della metà dei casi avrebbero potuto risparmiare fino al 70% dei costi relativi a recupero e riabilitazione dei giocatori” afferma Luca Pappalardo (PostDoc presso Cnr-Isti), uno degli autori di questi progetti.

Il gruppo di ricerca pisano ha anche sviluppato, in collaborazione con l’azienda italiana Wyscout, PlayeRank, un algoritmo open source per la valutazione delle performance dei calciatori. Il sistema, basato sull’intelligenza artificiale, funziona grazie a un database composto da milioni di eventi riguardanti quasi tutte le competizioni del globo, di cui viene registrata ogni interazione tra calciatori e palla, specificando il tipo di evento (passaggio, tiro, dribbling, ecc.), l’istante e la posizione del campo in cui è avvenuto. PlayeRank fornisce così la misurazione della performance di ogni calciatore su una serie di partite, consentendo di creare una classifica.

“Il lavoro è in fase di sottomissione sulla rivista ACM Transactions on Knowledge Discovery from Data (TKDD) e permette di osservare come varia la prestazione di un calciatore nel tempo, come fosse un titolo azionario. Si può studiare quindi come si sviluppa un talento, identificare quali siano i segnali predittivi di una crescita futura nel tempo”, spiega Paolo Cintia del Cnr-Isti.

Tramite questo algoritmo è possibile fornire un valore variabile ai calciatori come se fossero delle azioni in borsa e aiutare nelle sessioni di calciomercato le società sportive.

 

Siete interessati a toccare con mano questi scenari?

Il 12-13 ottobre a Pisa è in programma nell’ambito dell’Internet Festival la prima edizione di ‘Soccer Data Challenge’ (soccerchallenge.sobigdata.eu): una ‘maratona’ di 30 ore organizzata con SoBigData, in cui le squadre avranno a disposizione oltre 500 mila dati di una stagione di calcio, riguardanti più di 500 calciatori.

La Soccer data challenge è una competizione aperta a tutti gli appassionati di dati e calcio, che si svolgerà a Pisa il 12 e 13 ottobre 2018.
Per 30 ore consecutive, le squadre partecipanti si sfideranno sullo sviluppo di una soluzione per l’analisi di partite di calcio.

A loro disposizione avranno i dati di una intera stagione di serie A: oltre 500mila record, un dataset che contiene tutti gli eventi di gioco di ogni partita, definiti in ogni possibile aspetto. La squadra vincitrice si aggiudicherà un premio di 5.000 euro.

Per saperne di più potete visitare il sito web dell’evento.