Una moderna base dati e AI che collega il tracciamento dei giocatori, la biomeccanica e le operazioni alle decisioni sul campo e dell'ufficio.
Ogni secondo di una partita di basket professionistica genera ora oltre 20.000 punti dati dalle telecamere Hawk-Eye. In una partita di 48 minuti, ciò si traduce in decine di milioni di misurazioni posizionali. Da qualche parte all'interno di questo flusso si trovano le risposte alle domande che ossessionano le squadre: come prevenire gli infortuni, osservare più precisamente, analizzare le azioni, ottimizzare le formazioni e persino perfezionare la meccanica di tiro. La parte difficile è costruire le piattaforme dati e i modelli di IA che rispondano a queste domande in modo affidabile e su larga scala. Questi sistemi devono essere abbastanza veloci da cambiare ciò che accade sul campo, nello spogliatoio e in ufficio.
Nello sport professionistico, il volume di dati biomeccanici e di tracciamento non è mai stato così alto. Tuttavia, la capacità della maggior parte delle organizzazioni di utilizzare effettivamente questi dati per risolvere i propri casi d'uso chiave è rimasta quasi invariata. La Databricks Data Intelligence Platform aiuta i team di analisi sportiva a colmare questo divario, creando un'opportunità per i team di creare nuove capacità di Sports Intelligence per i propri giocatori e allenatori che consente loro di sbloccare finalmente il valore in questa enorme quantità di dati. Databricks aiuta i team a mantenere i giocatori più sani, vincere più partite, migliorare le prestazioni e operare in modo più efficiente in tutto il loro ecosistema.
Nel marzo 2023, l'NBA ha sostituito il tracciamento dei giocatori del centro di massa di Second Spectrum con il sistema SkeleTRACK di Sony Hawk-Eye in tutte le 29 arene. Il nuovo feed cattura 29 articolazioni scheletriche su ogni giocatore e arbitro, 13 persone sul campo in ogni momento, campionate 60 volte al secondo. Ciò equivale a circa 22.620 aggiornamenti posizionali al secondo, dell'ordine di 65 milioni di record per partita di 48 minuti, e circa 80 miliardi di record in una stagione regolare di 82 partite, senza contare i playoff o gli allenamenti.
Questo è un salto generazionale, con i dati SkeleTRACK circa due ordini di grandezza più ricchi e per la prima volta catturano la posa 3D completa in tempo reale. Ciò che i dati sbloccano non è il "rilevamento di oggetti" o la "visione artificiale". Questi sono i mezzi. I risultati effettivi sono le cose a cui tengono le squadre:
Anche lo strato di tracciamento si sta consolidando tra gli sport. Hawk-Eye è già impiegato nella Premier League, in tutti e quattro i tornei del Grande Slam di tennis, nel DRS del cricket, nello Statcast della MLB, nella NASCAR e in Formula 1. L'NHL ha ampliato la sua partnership di tracciamento di puck e giocatori con un'estensione biomeccanica che è il passo successivo ovvio, e la NFL sta seguendo da vicino. Qualunque fondamento un'organizzazione sportiva costruisca per Hawk-Eye in uno sport, servirà in tutti gli sport che pratica.
Hawk-Eye fornisce alle squadre il feed. Non fornisce le risposte. La domanda è: cosa ne fai?
All'interno di una moderna organizzazione sportiva professionistica, lo stack di analisi è spesso distribuito su componenti di più fornitori. I dati di tracciamento risiedono con un fornitore, i dispositivi indossabili con un altro, i video da qualche altra parte, l'osservazione degli avversari e le etichette degli eventi con un altro provider, e l'analisi degli infortuni con un altro ancora. Se combinato con la scala dei dati coinvolti, ciò può portare a molteplici sfide in tutto il settore.
Questi non sono problemi che un'altra soluzione puntuale risolverà. Il costo della frammentazione si traduce in segnali di infortunio persi, decisioni più lente durante la partita e incapacità di eseguire un'analisi cross-domain reale che combini dati di tracciamento con storia medica, carico di lavoro e tendenze degli avversari. Il pezzo mancante non è un altro strumento. Ciò di cui i team hanno bisogno è una piattaforma dati e IA governata in cui tutti quegli strumenti e flussi di dati possano convergere.
La Databricks Data Intelligence Platform è il centro componibile in cui i sistemi di tracciamento, indossabili, video, scouting, medici, operativi e di coinvolgimento dei fan di un'organizzazione convergono in un unico ambiente governato. Fornisce a un team le basi per trasformare gli output di tali sistemi in qualcosa di utilizzabile da un allenatore durante un time-out, un biomeccanico in un laboratorio e un GM alla scadenza del mercato.

Panoramica generale:
Ingestione. Lakeflow gestisce l'ingestione in streaming di feed Hawk-Eye, indossabili ed eventi alla velocità della partita. Auto Loader e pipeline dichiarative consentono ai team di implementare l'ingestione di produzione senza scrivere manualmente Spark personalizzato. Ciò è importante in un settore in cui l'organizzazione di analisi è spesso composta da poche persone.
Organizzazione. Un'architettura medallion raffina progressivamente i dati grezzi in insight utilizzabili. Bronze cattura fotogrammi continui a 60 Hz. Silver è il catalogo degli eventi: possessi, tiri, blocchi, abbinamenti difensivi, con intervalli di fotogrammi correlati all'output della telecamera e alla calibrazione dell'arena applicata. Gold è il livello di funzionalità pronto per l'analisi che guida i modelli e le dashboard.
Governo. Unity Catalog fornisce lineage, controllo degli accessi e auditabilità sull'intero ecosistema dati + IA. Ciò è importante quando i dati medici si trovano accanto ai dati sulle prestazioni. Ugualmente importante è la qualità e l'affidabilità dei dati. Il monitoraggio della lineage e della qualità consente a un team di dimostrare quali etichette di eventi ritiene attendibili, quale calibrazione dell'arena è derivata e quale modello downstream è stato addestrato su quale feed. Quel tipo di provenienza è il prerequisito per basare decisioni reali sui dati, e la maggior parte dei team oggi non lo ha.
Analisi. Modelli di ML come probabilità di tiro, rischio di infortuni e indice di affaticamento si addestrano all'interno della stessa piattaforma. Model Serving li distribuisce. AI Search rende il catalogo video interrogabile per somiglianza, in modo che un allenatore possa trovare ogni 3 contestato nel quarto quarto contro una difesa a cambio senza dover scorrere manualmente il nastro. Attraverso un'unica interfaccia, un team può anche accedere a qualsiasi modello fondazionale esterno per attività di visione-lingua come il rilevamento di infortuni da filmati di trasmissione o sostituire i propri modelli personalizzati o open source, un flusso di lavoro già in uso dai leader dell'analisi nello sport professionistico.
Servizio. Lakebase porta la latenza di query sub-secondo al livello interattivo, in modo che le applicazioni rivolte agli analisti e le dashboard a bordo campo non debbano attendere un warehouse. Databricks Apps ospita applicazioni di analisi personalizzate necessarie a team sportivi sofisticati: il visualizzatore biomeccanico 3D, l'app iPad a bordo campo, lo strumento di valutazione del front office. Eseguono sulla stessa piattaforma governata che produce i dati, senza uno stack di hosting separato.

Democratizza. Databricks Genie consente ad allenatori, preparatori e staff dirigenziale di porre domande in linguaggio naturale ("Come sono cambiate le meccaniche di tiro dei miei quintetti base nel terzo quarto contro la difesa a zona nelle ultime dieci partite?") e ottenere una risposta “istantanea”. Gli agenti AI gestiscono i flussi di lavoro multi-step dietro queste domande, eseguendo join e aggregazioni che prima richiedevano un analista reperibile.
Il punto è la componibilità, non la sostituzione. Una squadra che ha già Hawk-Eye mantiene Hawk-Eye. Una squadra che ha già Catapult mantiene Catapult. Il lakehouse rende interoperabili, governati e abbastanza veloci da usare gli output di questi investimenti.
Tre risultati degni di riflessione. Ce ne sono altri, ma questi sono quelli che sentiamo più spesso.
La disponibilità dei giocatori è una priorità assoluta in tutte le principali leghe sportive, con infortuni di giocatori di alto profilo che finiscono sui titoli tanto quanto le prestazioni dominanti. Oggi, la maggior parte delle squadre reagisce. Una stella si fa male in un'azione, lo staff medico diagnostica, il giocatore salta delle partite. I dati per prevedere (asimmetrie biomeccaniche, delta di carico in atterraggio, carico cumulativo) esistono nel feed. La piattaforma per combinarli tra diversi fornitori non esiste, nella maggior parte delle organizzazioni.
Con i dati scheletrici di Hawk-Eye unificati con il carico di lavoro, la storia medica e il contesto play-by-play in un'unica piattaforma governata, le squadre possono vedere segnali di avvertimento che nessun singolo sistema rileva da solo. Anomalie nel pattern di movimento nei giorni precedenti uno strappo del legamento crociato anteriore. Asimmetrie bilaterali che si correlano al rischio di lesioni al tendine d'Achille. Un carico cumulativo ad alta intensità che supera la soglia specifica del giocatore a cui tiene lo staff medico. Il passaggio è da reattivo a proattivo, ed è questa la conversazione che lo staff di allenamento può intraprendere con un capo allenatore e un GM con fiducia.
Durante un time-out, un assistente apre un iPad con l'analisi del matchup corrente. Quali lineup stanno producendo tiri efficienti contro la copertura a zona dell'avversario? Come influisce la vicinanza del difensore sul punto di rilascio dei nostri tiratori? Quali schemi che stiamo eseguendo stasera vengono eseguiti meccanicamente in modo pulito, e quali si degradano entro il quarto quarto? Quanto un difensore specifico sta disturbando la meccanica della nostra offensiva, al di là di quanto mostra il tabellino?
Questa capacità si basa su un servizio sub-secondo e app personalizzate, e richiede dati governati e puliti tali che allenatori e preparatori possano fidarsi di ciò che vedono. La maggior parte degli allenatori e preparatori non scrive SQL. Genie rende l'interfaccia in linguaggio naturale. Le app rendono l'esperienza mirata. Unity Catalog rende le risposte tracciabili. L'insight basato sull'AI diventa disponibile a ogni membro dello staff che ne ha bisogno, pur continuando a fornire al team di analisi gli strumenti per garantire con sicurezza che tali risposte siano affidabili e disponibili in modo costante.

La partita del giorno di Natale 2024 della NBA è stata la prima trasmissione completamente animata della lega basata sui dati SkeleTRACK. Quella è stata la prova di concetto. La piattaforma rende reale il modello di produzione. Le emittenti possono visualizzare overlay biomeccanici in tempo reale durante le partite in diretta. Partner di fantasy sport e scommesse possono consumare feed governati e arricchiti tramite Delta Sharing. Nuovi formati (replay 3D con contesto biomeccanico, pacchetti di highlight generati dall'AI, esperienze interattive second screen) diventano una questione di design piuttosto che di infrastruttura.
Il lakehouse che esegue il modello di rischio infortuni è lo stesso lakehouse che produce il feed di trasmissione. Questo è il compito della piattaforma, e un'organizzazione sportiva dovrebbe aspettarsi che la propria possa fare entrambe le cose da un'unica infrastruttura.
Il modello si generalizza in ogni sport ricco di tracciamento. Hawk-Eye nel calcio alimenta il VAR, il fuorigioco semi-automatico e l'analisi tattica. La biomeccanica del lancio di KinaTrax nella MLB guida la prevenzione degli infortuni al legamento collaterale ulnare, un problema da un miliardo di dollari di per sé. Le meccaniche del servizio nel tennis, le azioni di lancio nel cricket e la prossima ondata di tracciamento scheletrico in arrivo nella NFL condividono tutte la stessa forma: dati spaziali ad alta frequenza, più video, più dati medici, più contesto, unificati, governati e serviti velocemente.
Gli stessi schemi si estendono completamente al di fuori dello sport. Cattura del movimento in sanità, robotica industriale, percezione dei veicoli autonomi. Ovunque un team abbia dati multi-modali ad alta frequenza, il lakehouse fornisce la stessa soluzione robusta e componibile.
Per i leader della data science, dell'analisi e delle performance, il tracciamento scheletrico non è più un'ipotesi; è già qui o è in arrivo. L'unica domanda è se la tua piattaforma è pronta.
Scopri di più su Databricks per Media & Entertainment, o richiedi una demo per vedere come la tua organizzazione può generare insight competitivi.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.