“Il serve&volley di Djokovic? Se lo avesse ripetuto, Thiem lo avrebbe passato…”

Dopo l’intervista a Fabrice Sbarro recentemente pubblicata (qui la prima parte, qui la seconda), Ubitennis vi propone un’altra chiacchierata via Zoom con un esperto di dati. Il nostro interlocutore questa volta è Shane Liyanage, fondatore della start up australiana Data Driven Sports Analytics, che nell’estate dello scorso anno ha collaborato con il team di Thomas Fabbiano, periodo nel quale il nostro portacolori ha inanellato una serie di prestazioni rimarchevoli, fra cui la semifinale a Eastbourne e le vittorie di prestigio a Wimbledon contro Stefanos Tsitsipas e agli US Open contro Dominic Thiem.

Di seguito trovate il video dell’intervista integrale, in lingua inglese, che è stata registrata in data 16 maggio.


D: Ciao Shane, come stai? Siamo rimasti molto impressionati dal tuo lavoro. Visto che probabilmente il tuo nome non è noto al grande pubblico, vuoi raccontarci qualcosa di te e della tua storia?
R: Grazie per l’invito, è un piacere fare questa chiacchierata con Ubitennis. Questa settimana avrei dovuto essere a Roma per il Masters 1000 ma ovviamente sono rimasto a Melbourne. Sono sicuro che il prossimo anno potremo recuperare. Parlando del mio background, direi che nel mio caso si è trattato di un viaggio che mi ha portato a toccare diversi settori, accademici, imprenditoriali e sportivi. A livello di studi ho unito un background universitario dato dalla mia laurea in finance e data science a cui ho aggiunto un master in sport analytics. Insomma ho sempre lavorato con i numeri, anche fuori dall’ambito sportivo, fino a che ho deciso di creare una compagnia focalizzata sull’analisi dei dati in ambito sportivo, Data Driven Sports Analytics. Così ho potuto unire i miei interessi lavorativi con la mia passione sportiva, visto che ho giocato a livello semiprofessionistico da juniores, anche se mi rendevo conto che non avrei sfondato.

Così col passare del tempo ho capito che sfruttando le mie competenze sull’analisi dei dati avrei potuto rientrare nel mondo del tennis cercando di lasciare il segno. Oltre a collaborazioni con tennisti professionistici ho collaborato anche con progetti giornalistici per lavori di data visualization e con la federazione australiana di cricket. Di recente sto collaborando con alcune Accademie, ad esempio con Federico Placidilli, ex allenatore di Thomas Fabbiano e membro della Lubrano Tennis Acadaemy di Genova, e con giovani prospetti, fra cui Nicholas David Ionel, che ha vinto il doppio all’Australian Open Juniores 2020. In Italia ci passo spesso, a novembre ero in Val Gardena per il challenger vinto da Sinner perché ero curioso di vedere il ragazzo giocare. La mia impressione è che abbia tutte le caratteristiche dei grandi giocatori, tecnicamente mi ricorda un po’ Berdych, ma con la prospettiva di avere la capacità di reggere la pressione.

Mi sembra una storia molto interessante e credo che non ci siano molte persone con un profilo simile al tuo che si occupano di tennis… è solo una percezione o è la realtà?
Credo che nel tennis probabilmente sia un’affermazione corretta, ma se guardiamo ad altri sport come l’NBA, tante squadre hanno analisti dedicati proprio alla determinazione delle metriche e delle performance per individuare i giocatori che si adattano di più a un particolare tipo di gioco o che hanno migliori livelli di efficienza. Probabilmente il tennis rispetto all’NBA è 5-10 anni indietro, ma credo che le cose stiano cambiando. Vedo sempre più federazioni che stanno collaborando: ad esempio è cosa nota che Craig O’Shannessy stia lavorando con la federazione italiana e con Berrettini. Mi aspetto insomma che questo diventerà sempre più la norma e che i grandi giocatori con maggiori disponibilità avranno sempre di più dei ‘data scientists’ nei loro team.

Parlando di oggi, credi che ci siano già parecchi giocatori che si avvalgono della consulenza di esperti di dati come te?
Credo che ce ne siano, soprattutto fra i grandi giocatori e potrebbe essere fonte di un ulteriore vantaggio competitivo per loro. Ad esempio Djokovic ha lavorato con O’Shannessy, Federer si avvale delle analisi di Golden Set Analytics, Moya sono quasi certo che abbia qualche fonte di dati, anche se Nadal è abbastanza conservativo sul tema. In ambito femminile lo stesso Darren Cahill che ha portato la Halep sul tetto del mondo si avvale di servizi statistici. Anche molte federazioni si stanno muovendo, utilizzando sia modelli basati su tagging manuale che su dati Hawk-eye. Credo insomma che nei prossimi 5-10 anni ci sarà un processo di “democratizzazione”, nel quale tennisti anche con classifiche più basse, tipo top 100, cominceranno a usare questi strumenti. Insomma, diventerà “the new normal”.

Shane, prima stavi parlando sia di tagging manuale che di dati hawk-eye, vorrei capire meglio la tua metodologia, come costruisci il tuo database? E quanti match ti servono per essere sicuro dei risultati che produci?
Senza entrare troppo nel dettaglio direi che ci sono tre componenti fondamentali nel mio lavoro: la prima è quella che ha che fare con il catturare i dati; la seconda consiste nell’analizzarli; la terza è invece la rappresentazione delle informazioni estratte per gli utenti finali. In termini di basi dati noi utilizziamo un “data lake(un ‘magazzino di dati’ centralizzato nel quale sono raccolti dati strutturati e non strutturati provenienti da diverse fonti. Insomma, dati grezzi e non ancora elaborati, ndr). Le fonti di dati sono varie, da input da sistemi di rilevazione come Zenniz, dati HawkEye come nel caso degli Australian open, fino a video tagging, manuali o automatici dei singoli match.

Al momento però siamo in una fase in cui prevale ancora il tagging manuale, anche se stiamo collaborando con un’impresa che lavora su sistemi di intelligenza artificiale per il tagging automatico dei match; su questo fronte stiamo ancora in fase di test, ma abbiamo già raggiunto un’accuratezza del 60%. Certo poi capita ancora che il sistema confonda il berretto di un tennista con la pallina, ma sicuramente questo è il futuro. Credo che in generale sia importante avere un modello di dati flessibile a sufficienza per incorporare ogni nuova fonte che possa venire fuori. Anche perché stanno venendo fuori tanti diversi fornitori tecnologici, diversi wearable (dispositivi indossabili, ndr) che ovviamente producono moli di dati importanti in forme anche diverse. Al momento abbiamo più di 4000 match catalogati e quando lavoro con un cliente ho la necessità di avere a disposizione almeno 50 match per fornire delle analisi solide e poter descrivere dei pattern di gioco sufficientemente sicuri.

Ok, andiamo oltre questi aspetti tecnici e vediamo più in dettaglio su cosa ti concentri nei tuoi report e nelle tue analisi: se più focalizzato nel dare consigli tattici rispetto a come giocare contro uno specifico avversario o piuttosto è un lavoro più a lungo termine di analisi dei pattern di gioco per capire cosa funziona e cosa no?
Credo che davvero dipenda dalla situazione: durante un torneo ovviamente la cosa più importante è andare avanti il più possibile e superare gli avversari che di volta in volta si presentano. E quindi cercare di capire i punti di forza e di debolezza dell’avversario. Ma al di fuori del torneo l’attenzione è sul gioco dell’assistito per capire che miglioramenti apportare al gioco del tennista con cui sto lavorando. Alcuni miglioramenti possono essere anche rapidi, magari se il tempo è limitato, in un paio di settimane ci si può concentrare su due o tre aspetti e vedere come va. Tuttavia, quando invece si parla di pattern di gioco consolidati, per riuscire a produrre dei veri cambiamenti ci vuole più tempo, almeno un mese o due. E quindi le modifiche più sostanziali si lasciano per la off season. Volendo generalizzare, direi che durante i tornei il focus è sull’avversario, mentre al di fuori è sul giocatore stesso.

Ho avuto modo di vedere un esempio di report che fornisci ai giocatori (di cui riportiamo qualche stralcio) e sono rimasto colpito in particolare da due concetti inusuali, ma che mi sembrano di grande potenziale: “predictability” e “shot chain analysis” (minuto 15:30 dell’intervista).
Sì certo, è un tema su cui vorrei incoraggiare maggiori riflessioni, e di cui ho recentemente parlato nel podcast “First serve”. La vera sfida con l’idea di prevedibilità è la necessità di cercare di non utilizzare troppo i migliori schemi di gioco che dovrebbero essere limitati alle situazioni di maggior pressione. D’altronde utilizzarli troppo poco sarebbe dannoso, per cui si deve cercare un bilanciamento fra queste due esigenze. Per questo motivo cerco di fornire una duplice informazione nei miei report: da un lato la prevedibilità di certe giocate e dall’altro quella che definisco come “score pattern robustness”, che invece giudica il successo di quel tipo di giocata. Pertanto il giusto mix è cercare di far calare lo score di imprevedibilità fino al punto in cui comincia a crollare lo “score pattern robustness”, che invece indica il successo di quella giocata.

Volendo applicare questi concetti a dei casi reali, possiamo dire ad esempio che Nadal per anni contro Federer ha usato degli schemi di gioco estremamente prevedibili, come giocare con colpi carichi di effetto sul rovescio dello svizzero, ma che al contempo mantenevano un alto indice di successo (o ‘robustness’). In altri casi tale correlazione non è altrettanto chiara e il mio obiettivo è proprio quello di aiutare coach e giocatori a trovare il giusto mix. Ma se ad esempio guardiamo il serve and volley, vediamo subito che tale tattica nella maggior parte dei casi può funzionare se utilizzata con cura, in caso contrario l’efficacia crolla. Siamo quindi in presenza di uno schema di gioco in cui a un leggero calare dell’imprevedibilità crolla l’efficacia.

(clicca per ingrandire)

Sì, il margine fra coraggio e follia nel serve&volley è molto ristretto. Ad esempio Djokovic, contro Thiem in finale a Melbourne, improvvisò un serve&volley su un break point decisivo nel quarto set; in quell’occasione il serbo riuscì a salvarsi e poi a vincere il match, ma se avesse perso il punto? A differenza di un dado, dove ad ogni lancio c’è la stessa probabilità di ottenere un risultato, nel tennis lo schema di gioco ha influenza sul risultato finale.
Sì è vero, in quel caso è stato bravo e fortunato a vincere il punto. Ma quello che vorrei sottolineare è che se nel punto successivo Djokovic avesse ripetuto la discesa a rete ritengo molto probabile che Thiem avrebbe finito col passarlo. È una cosa che effettivamente può utilizzare ogni tanto, magari ogni 3-4 game. In sintesi, a meno che un giocatore non abbia delle armi devastanti che anche se prevedibili sono ingestibili da parte degli avversari, lo sforzo tattico deve concentrarsi nel trovare il giusto mix fra imprevedibilità ed efficienza degli schemi di gioco.

Un’altra cosa che mi sembra molto utile è la ‘shot chain analysis‘, ed è un tipo di analisi che difficilmente si trova in giro: puoi farci capire come ti è venuta questa idea?
Dalle mie esperienze nel settore privato, dove ho potuto studiare dati grezzi relativi alle transazioni nella grande distribuzione e mi occupavo di analisi dei dati per capire le correlazioni. Se ad esempio risulta che pane e latte vengono spesso comprati assieme, si sceglie di sistemarli ai due estremi del punto vendita in modo da portare il consumatore ad attraversare tutto il negozio e aumentare le possibilità di acquisto. Applicando queste logiche al tennis, abbiamo la shot chain analysis. Cerco di mostrare quali sequenze di colpi all’interno di uno scambio sono più ricorrenti e quali sono quelle più efficienti in termini di punti vinti e persi. Un’altra cosa che facciamo è ragionare per piccole catene di colpi, ad esempio tre, in quanto nella maggior parte dei casi gli scambi tendono ad essere brevi. Spesso è necessario mostrare ai giocatori anche dei video per associare i dati alla percezione empirica in modo da visualizzare meglio. E quindi cerchiamo di disegnare il quadro e operare anche dal punto di vista psicologico per convincere giocatori e coach del messaggio che proponiamo.

(clicca per ingrandire)

Questo aspetto psicologico mi sembra un punto importante: come fai a convincere i giocatori? E a renderti credibile? Alla fine poi in campo ci vanno i tennisti e sono soli.
Credo che sia importante avere il supporto di tutto il team, ovviamente è il giocatore che scende in campo e non tutti i suggerimenti vengono messi in pratica. Il punto di partenza è il coach. Per me è importante discutere prima con il coach gli obiettivi e capire dove vogliamo arrivare; questi obiettivi devono essere realistici, non ci sono formule magiche che funzionano in maniera garantita. E poi si definiscono degli indicatori (Key performance indicator) per monitorare periodicamente come stiamo andando, come nelle aziende. La maggior parte del rapporto è con i coach e secondo me un aspetto importante è cercare di fornire degli insight coerenti con la loro filosofia. Ad esempio alcuni vogliono una review immediata del match, al fine di prenderla come base per la partita successiva, altri invece pensano già all’avversario e alla partita successiva. La catena della fiducia deve passare per forza per il coach.

Un’ultima domanda. Partendo dalla tua idea del futuro e rispetto alla cultura dei dati nel tennis: cosa ci possiamo aspettare?
Mi piacerebbe vedere più dati disponibili nel tennis ovviamente. Però ci sono stati dei miglioramenti rispetto a cinque anni fa, abbiamo una community di esperti di dati più ampia. Ovviamente non è come nella NBA o nella MLB, in cui i dataset disponibili liberamente sono incredibili e i fan possono “giocarci”, anche a livello giornalistico le analisi ne traggono giovamento. Sui social media le discussioni sono spesso di alto livello e analizzano anche metriche avanzate (come ad esempio gli expected goals che stanno arrivando anche nel mondo del calcio, ndr).

Uno dei problemi con il tennis è che le statistiche disponibili sono spesso aggregate e non disponibili a livello di singoli colpi. Spesso anche i giornalisti accreditati a un evento ricevono solo delle informazioni aggregate e poco altro (possiamo confermare: poco più che punti vinti, percentuali di prime di servizio o punti vinti con la prima, ndr). I dati HawkEye dovrebbero essere liberamente disponibili e non visibili solo a volte durante i match. La soluzione potrebbe essere l’utilizzo di tecniche di intelligenza artificiale per la mappatura dei match. Credo che nel giro di 18-24 mesi si possa arrivare ad avere molti più dati ‘lavorabili’ per tifosi e addetti ai lavori. Ci saranno sempre più persone in questo settore e se ci ritroveremo a parlare di queste cose fra un paio d’anni (noi di Ubitennis sicuramente coglieremo al volo l’invito, ndr) credo che le cose saranno diverse.