Una base moderna de datos e IA que conecta el seguimiento de jugadores, la biomecánica y las operaciones con las decisiones en la cancha y de la oficina principal
por Corey Abshire, Kush Patel y Nick Ragonese
Cada segundo de un partido de baloncesto profesional genera ahora más de 20.000 puntos de datos de las cámaras Hawk-Eye. A lo largo de un partido de 48 minutos, eso suma decenas de millones de mediciones de posición. En algún lugar de esa transmisión se encuentran las respuestas a las preguntas que obsesionan a los equipos: cómo prevenir lesiones, explorar con mayor precisión, diseccionar jugadas, optimizar alineaciones e incluso ajustar la mecánica de tiro. La parte difícil es construir las plataformas de datos y los modelos de IA que respondan a esas preguntas de manera confiable y a escala. Estos sistemas deben ser lo suficientemente rápidos como para cambiar lo que sucede en la cancha, en el vestuario y en la oficina.
En todos los deportes profesionales, el volumen de datos biomecánicos y de seguimiento nunca ha sido tan alto. Sin embargo, la capacidad de la mayoría de las organizaciones para utilizar realmente estos datos para resolver sus casos de uso clave apenas ha avanzado. La Plataforma de Inteligencia de Datos de Databricks ayuda a los equipos de datos deportivos a llenar este vacío, creando una oportunidad para que los equipos creen nuevas capacidades de Inteligencia Deportiva para sus jugadores y entrenadores que les permitan finalmente desbloquear el valor de esta enorme cantidad de datos. Databricks ayuda a los equipos a mantener a los jugadores más sanos, ganar más partidos, mejorar el rendimiento y operar de manera más eficiente en todo su ecosistema.
En marzo de 2023, la NBA reemplazó el seguimiento de jugadores de centro de masa de Second Spectrum con el sistema SkeleTRACK de Sony Hawk-Eye en las 29 arenas. La nueva alimentación captura 29 articulaciones esqueléticas en cada jugador y árbitro, 13 personas en la cancha en cualquier momento, muestreadas 60 veces por segundo. Eso equivale a aproximadamente 22.620 actualizaciones de posición por segundo, del orden de 65 millones de registros por partido de 48 minutos, y aproximadamente 80 mil millones de registros en una temporada regular de 82 partidos antes de contar los playoffs o la práctica.
Este es un salto generacional, con datos de SkeleTRACK aproximadamente dos órdenes de magnitud más ricos y que por primera vez capturan la pose completa en 3D en tiempo real. Lo que los datos desbloquean no es "detección de objetos" o "visión por computadora". Esos son los medios. Los resultados reales son las cosas que importan a los equipos:
La capa de seguimiento también se está consolidando en todos los deportes. Hawk-Eye ya está desplegado en la Premier League, los cuatro Grand Slams de tenis, el DRS de Cricket, Statcast de la MLB, NASCAR y la Fórmula 1. La NHL ha ampliado su asociación de seguimiento de discos y jugadores, siendo la extensión biomecánica el siguiente paso obvio, y la NFL sigue de cerca. Cualquiera que sea la base que una organización deportiva construya para Hawk-Eye en un deporte, le servirá en todos los deportes que practique.
Hawk-Eye proporciona la alimentación a los equipos. No les da las respuestas. La pregunta es: ¿qué haces con ella?
Dentro de una organización deportiva profesional moderna, la pila de análisis a menudo se distribuye entre componentes de múltiples proveedores. Los datos de seguimiento viven con un proveedor, los wearables con otro, el video en otro lugar, la exploración de oponentes y las etiquetas de eventos con un proveedor diferente, y el análisis de lesiones con otro. Cuando se combina con la escala de los datos involucrados, esto puede generar múltiples desafíos en toda la industria.
Estos no son problemas que otra solución puntual resolverá. El costo de la fragmentación se traduce en señales de lesiones perdidas, decisiones más lentas durante el juego e incapacidad para realizar un análisis verdaderamente interdominio que combine datos de seguimiento con historial médico, carga de trabajo y tendencias del oponente. La pieza que falta no es otra herramienta. Lo que los equipos necesitan es una plataforma de datos e IA gobernada donde todas esas herramientas y flujos de datos puedan converger.
La Plataforma de Inteligencia de Datos de Databricks es el centro componible donde los sistemas de seguimiento, wearables, video, exploración, médicos, operativos y de participación de los fanáticos de una organización se unen en un único entorno gobernado. Le da a un equipo la base para convertir las salidas de esos sistemas en algo utilizable por un entrenador en un tiempo muerto, un biomecánico en un laboratorio y un gerente general en la fecha límite de intercambio.

Descripción general de alto nivel:
Ingesta. Lakeflow maneja la ingesta de transmisiones de datos de Hawk-Eye, wearables y eventos a la velocidad del juego. Auto Loader y las canalizaciones declarativas permiten a los equipos configurar la ingesta de producción sin escribir Spark personalizado a mano. Eso es importante en una industria donde la organización de análisis suele ser un puñado de personas.
Organización. Una arquitectura Medallion refina progresivamente los datos brutos en información utilizable. Bronze captura fotogramas continuos de 60 Hz. Silver es el catálogo de eventos: posesiones, tiros, bloqueos, emparejamientos defensivos, con rangos de fotogramas correlacionados con la salida de la cámara y la calibración de la arena aplicada. Gold es la capa de características listas para el análisis que impulsa los modelos y los paneles.
Gobernanza. Unity Catalog proporciona linaje, control de acceso y auditabilidad en todo el patrimonio de datos + IA. Eso es importante cuando los datos médicos se encuentran junto a los datos de rendimiento. Igualmente importante es la calidad y la confianza de los datos. El linaje y el monitoreo de la calidad permiten a un equipo probar qué etiquetas de eventos confían, qué calibración de la arena se desvió y qué modelo descendente se entrenó con qué alimentación. Ese tipo de procedencia es la precondición para basar decisiones reales en los datos, y la mayoría de los equipos no lo tienen hoy.
Análisis. Los modelos de ML como la probabilidad de tiro, el riesgo de lesión y el índice de fatiga se entrenan dentro de la misma plataforma. Model Serving los implementa. AI Search hace que el catálogo de video se pueda consultar por similitud, para que un entrenador pueda encontrar cada 3 disputado en el último cuarto contra una defensa cambiante sin tener que revisar manualmente la cinta. A través de una única interfaz, un equipo también puede acceder a cualquier modelo fundacional externo para tareas de visión y lenguaje como la detección de lesiones a partir de imágenes de transmisión o reemplazar sus propios modelos personalizados o de código abierto, un flujo de trabajo que ya utilizan los líderes de análisis en todos los deportes profesionales.
Servicio. Lakebase aporta latencia de consulta de subsegundos a la capa interactiva, para que las aplicaciones orientadas al analista y los paneles de control en la cancha no tengan que esperar a un almacén. Databricks Apps aloja aplicaciones de análisis personalizadas necesarias para equipos deportivos sofisticados: el visor biomecánico 3D, la aplicación de iPad junto a la cancha, la herramienta de evaluación de la oficina central. Se ejecutan en la misma plataforma gobernada que produce los datos, sin una pila de alojamiento separada.

Democratizar. Databricks Genie permite que entrenadores, preparadores físicos y personal de oficina hagan preguntas en lenguaje natural ("¿Cómo han cambiado las mecánicas de tiro de mis cinco titulares en el tercer cuarto contra defensas en zona en los últimos diez partidos?") y obtengan una respuesta “en el momento”. Los agentes de IA manejan los flujos de trabajo de varios pasos detrás de esas preguntas, ejecutando las uniones y agregaciones que antes requerían un analista disponible.
El objetivo es la componibilidad, no el reemplazo. Un equipo que ya tiene Hawk-Eye mantiene Hawk-Eye. Un equipo que ya tiene Catapult mantiene Catapult. El lakehouse hace que los resultados de esas inversiones sean interoperables, gobernados y lo suficientemente rápidos para su uso.
Tres resultados que vale la pena reflexionar. Hay más, pero estos son los que escuchamos con más frecuencia.
La disponibilidad de los jugadores es una prioridad máxima en todas las principales ligas deportivas, y las lesiones de jugadores de alto perfil acaparan los titulares tanto como las actuaciones dominantes. Hoy en día, la mayoría de los equipos reaccionan. Una estrella se lesiona en una jugada, el personal médico diagnostica, el jugador se pierde tiempo. Los datos para predecir (asimetrías biomecánicas, deltas de carga de aterrizaje, carga acumulada) existen en el feed. La plataforma para combinarlo entre proveedores no existe, en la mayoría de las organizaciones.
Con los datos esqueléticos de Hawk-Eye unificados con la carga de trabajo, el historial médico y el contexto jugada a jugada en una plataforma gobernada, los equipos pueden ver señales de advertencia que ningún sistema individual detecta por sí solo. Anomalías en el patrón de movimiento en los días previos a un desgarro del LCA. Asimetrías bilaterales que se correlacionan con el riesgo de Aquiles. Una carga acumulada de alta intensidad que cruza el umbral específico del jugador que le importa al personal médico. El cambio es de reactivo a proactivo, y esa es la conversación que el personal de entrenamiento puede tener con un entrenador principal y un gerente general con confianza.
Durante un tiempo muerto, un asistente saca un iPad con el análisis del enfrentamiento actual. ¿Qué alineaciones están produciendo tiros eficientes contra la cobertura de cambios del oponente? ¿Cómo afecta la proximidad del defensor al punto de lanzamiento de nuestros tiradores? ¿Qué jugadas estamos ejecutando esta noche se ejecutan mecánicamente de manera limpia y cuáles se degradan en el último cuarto? ¿Cuánto está interrumpiendo un defensor específico las mecánicas de nuestra ofensiva, más allá de lo que muestra el box score?
Esa capacidad se asienta sobre un servicio de subsegundo y aplicaciones personalizadas, y requiere datos gobernados y limpios que los entrenadores y preparadores físicos puedan confiar en lo que ven. La mayoría de los entrenadores y preparadores físicos no escriben SQL. Genie hace que la interfaz sea en lenguaje natural. Las aplicaciones hacen que la experiencia esté diseñada para un propósito específico. Unity Catalog hace que las respuestas sean rastreables. La información impulsada por IA se vuelve accesible para cada miembro del personal que la necesita, al tiempo que brinda al equipo de análisis las herramientas para garantizar con confianza que esas respuestas sean confiables y estén disponibles de manera fiable.

El partido de Navidad de 2024 de la NBA fue la primera transmisión completamente animada de la liga basada en datos de SkeleTRACK. Esa fue la prueba de concepto. La plataforma hace que el modelo de producción sea real. Las cadenas pueden renderizar superposiciones biomecánicas en tiempo real durante los partidos en vivo. Los socios de fantasía y apuestas pueden consumir feeds gobernados y enriquecidos a través de Delta Sharing. Nuevos formatos (repeticiones 3D con contexto biomecánico, paquetes de highlights generados por IA, experiencias interactivas de segunda pantalla) se convierten en una cuestión de diseño en lugar de infraestructura.
El lakehouse que ejecuta el modelo de riesgo de lesiones es el mismo lakehouse que produce el feed de transmisión. Ese es el trabajo de la plataforma, y una organización deportiva debería esperar que la suya haga ambas cosas desde una única plataforma.
El patrón se generaliza en todos los deportes con mucho seguimiento. Hawk-Eye en fútbol potencia el VAR, el fuera de juego semiautomático y el análisis táctico. La biomecánica de lanzamiento de KinaTrax en la MLB impulsa la prevención de lesiones del LCA, un problema de mil millones de dólares por sí solo. La mecánica del servicio de tenis, las acciones de lanzamiento de cricket y la próxima ola de seguimiento esquelético que llega a la NFL comparten la misma forma: datos espaciales de alta frecuencia, más video, más medicina, más contexto, unificados, gobernados y servidos rápidamente.
Los mismos patrones se extienden completamente fuera de los deportes. Captura de movimiento en atención médica, robótica de fabricación, percepción de vehículos autónomos. Dondequiera que un equipo tenga datos multimodales de alta frecuencia, el lakehouse proporciona la misma solución robusta y componible.
Para los líderes en ciencia de datos, análisis y rendimiento, el seguimiento esquelético ya no es una hipótesis; o ya está aquí o está en camino. La única pregunta es si su plataforma está lista para ello.
Obtenga más información sobre Databricks para Medios y Entretenimiento, o solicite una demostración para ver cómo su organización puede generar información competitiva.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.