Ir al contenido principal
Industria

El auge de la inteligencia deportiva: cómo el Lakehouse convierte los datos de seguimiento en ventaja competitiva

Una base moderna de datos e IA que conecta el seguimiento de jugadores, la biomecánica y las operaciones con las decisiones en la cancha y de la oficina principal

por Corey Abshire, Kush Patel y Nick Ragonese

  • Muestre cómo los equipos profesionales convierten los datos explosivos de seguimiento y biomecánica (como el SkeleTRACK de Hawk-Eye de la NBA) en inteligencia deportiva que realmente cambia las decisiones en la cancha, en la sala de entrenamiento y en la oficina principal.
  • Utilice la Plataforma de Inteligencia de Datos de Databricks como el "cerebro deportivo" gobernado donde los datos de seguimiento, médicos, portátiles, de video, de exploración y de aficionados aterrizan en un lakehouse, luego aplique Lakeflow, Unity Catalog, ML, AI Search y aplicaciones sub-segundo para potenciar flujos de trabajo en tiempo real.
  • Destaca resultados concretos: gestión proactiva de lesiones y cargas de trabajo, información de entrenamiento en tiempo real sobre emparejamientos y mecánica, y experiencias de próxima generación para aficionados y transmisiones como superposiciones biomecánicas y repeticiones interactivas basadas en datos.

Cada segundo de un partido de baloncesto profesional genera ahora más de 20.000 puntos de datos de las cámaras Hawk-Eye. A lo largo de un partido de 48 minutos, eso suma decenas de millones de mediciones de posición. En algún lugar de esa transmisión se encuentran las respuestas a las preguntas que obsesionan a los equipos: cómo prevenir lesiones, explorar con mayor precisión, diseccionar jugadas, optimizar alineaciones e incluso ajustar la mecánica de tiro. La parte difícil es construir las plataformas de datos y los modelos de IA que respondan a esas preguntas de manera confiable y a escala. Estos sistemas deben ser lo suficientemente rápidos como para cambiar lo que sucede en la cancha, en el vestuario y en la oficina.

En todos los deportes profesionales, el volumen de datos biomecánicos y de seguimiento nunca ha sido tan alto. Sin embargo, la capacidad de la mayoría de las organizaciones para utilizar realmente estos datos para resolver sus casos de uso clave apenas ha avanzado. La Plataforma de Inteligencia de Datos de Databricks ayuda a los equipos de datos deportivos a llenar este vacío, creando una oportunidad para que los equipos creen nuevas capacidades de Inteligencia Deportiva para sus jugadores y entrenadores que les permitan finalmente desbloquear el valor de esta enorme cantidad de datos. Databricks ayuda a los equipos a mantener a los jugadores más sanos, ganar más partidos, mejorar el rendimiento y operar de manera más eficiente en todo su ecosistema.

La Explosión de Datos

En marzo de 2023, la NBA reemplazó el seguimiento de jugadores de centro de masa de Second Spectrum con el sistema SkeleTRACK de Sony Hawk-Eye en las 29 arenas. La nueva alimentación captura 29 articulaciones esqueléticas en cada jugador y árbitro, 13 personas en la cancha en cualquier momento, muestreadas 60 veces por segundo. Eso equivale a aproximadamente 22.620 actualizaciones de posición por segundo, del orden de 65 millones de registros por partido de 48 minutos, y aproximadamente 80 mil millones de registros en una temporada regular de 82 partidos antes de contar los playoffs o la práctica.

Este es un salto generacional, con datos de SkeleTRACK aproximadamente dos órdenes de magnitud más ricos y que por primera vez capturan la pose completa en 3D en tiempo real. Lo que los datos desbloquean no es "detección de objetos" o "visión por computadora". Esos son los medios. Los resultados reales son las cosas que importan a los equipos:

  • Comprender cómo cambian las mecánicas de un tirador al final del partido a medida que la fatiga altera el ángulo del codo y la altura de lanzamiento.
  • Detectar cambios sutiles en los patrones de movimiento que preceden a las lesiones del LCA y el tendón de Aquiles.
  • Cuantificar cómo los esquemas defensivos, la proximidad del defensor y la jugada específica que se está ejecutando alteran la precisión del tiro.
  • Comparar la carga biomecánica entre partidos para optimizar las decisiones de descanso y reducir las lesiones.
  • Personalizar el desarrollo de habilidades mapeando las mecánicas únicas de cada atleta a sus resultados de aciertos/fallos en lugar de forzar un modelo de entrenamiento genérico.
  • Diseñar perfiles de movimiento específicos para roles y posiciones para que los equipos puedan reclutar, intercambiar y desarrollar jugadores cuyas biomecánicas se ajusten a su sistema.

La capa de seguimiento también se está consolidando en todos los deportes. Hawk-Eye ya está desplegado en la Premier League, los cuatro Grand Slams de tenis, el DRS de Cricket, Statcast de la MLB, NASCAR y la Fórmula 1. La NHL ha ampliado su asociación de seguimiento de discos y jugadores, siendo la extensión biomecánica el siguiente paso obvio, y la NFL sigue de cerca. Cualquiera que sea la base que una organización deportiva construya para Hawk-Eye en un deporte, le servirá en todos los deportes que practique.

Hawk-Eye proporciona la alimentación a los equipos. No les da las respuestas. La pregunta es: ¿qué haces con ella?

La Brecha de Integración

Dentro de una organización deportiva profesional moderna, la pila de análisis a menudo se distribuye entre componentes de múltiples proveedores. Los datos de seguimiento viven con un proveedor, los wearables con otro, el video en otro lugar, la exploración de oponentes y las etiquetas de eventos con un proveedor diferente, y el análisis de lesiones con otro. Cuando se combina con la escala de los datos involucrados, esto puede generar múltiples desafíos en toda la industria.

  • Silos de "verdad". El equipo de rendimiento, el personal médico y el cuerpo técnico trabajan con su propia "versión" (a menudo contradictoria) de los mismos datos del jugador, y la conciliación lleva semanas.
  • Latencia que se acumula. Cada paso entre proveedores introduce retrasos. Algunas preguntas necesitan respuestas en tiempo real en el banquillo, otras solo necesitan estar allí por la mañana a un costo razonable, pero la mayoría de los equipos luchan por cumplir con cualquiera de las dos de manera confiable.
  • Sin gobernanza ni etiquetas confiables. ¿Quién tiene acceso a qué? ¿Se puede rastrear una predicción hasta el registro médico, el archivo del wearable y el fotograma de la cámara que la generó? ¿Se puede confiar en una etiqueta de evento de un proveedor externo cuando se sabe que a veces es incorrecta? La mayoría de los equipos siguen utilizando esas etiquetas de todos modos, plenamente conscientes de los problemas pero limitados por las herramientas que tienen hoy.
  • Conciliación de arenas. Las posiciones de las cámaras, la geometría de la cancha y la deriva de la calibración difieren entre los lugares. Incluso la salida bruta de Hawk-Eye requiere normalización antes de que sea comparable partido a partido.
  • Computación que no escala. 953.000 fotogramas por partido superan los límites de las tablas tradicionales de los almacenes de datos. Los equipos de ciencia de datos deportivos recurren rutinariamente a Python local en un portátil, descargando muestras y esperando que la muestra sea representativa.

Estos no son problemas que otra solución puntual resolverá. El costo de la fragmentación se traduce en señales de lesiones perdidas, decisiones más lentas durante el juego e incapacidad para realizar un análisis verdaderamente interdominio que combine datos de seguimiento con historial médico, carga de trabajo y tendencias del oponente. La pieza que falta no es otra herramienta. Lo que los equipos necesitan es una plataforma de datos e IA gobernada donde todas esas herramientas y flujos de datos puedan converger.

Inteligencia Deportiva en el Lakehouse

La Plataforma de Inteligencia de Datos de Databricks es el centro componible donde los sistemas de seguimiento, wearables, video, exploración, médicos, operativos y de participación de los fanáticos de una organización se unen en un único entorno gobernado. Le da a un equipo la base para convertir las salidas de esos sistemas en algo utilizable por un entrenador en un tiempo muerto, un biomecánico en un laboratorio y un gerente general en la fecha límite de intercambio.

Sports Intelligence on the Lakehouse

Descripción general de alto nivel:

Ingesta. Lakeflow maneja la ingesta de transmisiones de datos de Hawk-Eye, wearables y eventos a la velocidad del juego. Auto Loader y las canalizaciones declarativas permiten a los equipos configurar la ingesta de producción sin escribir Spark personalizado a mano. Eso es importante en una industria donde la organización de análisis suele ser un puñado de personas.

Organización. Una arquitectura Medallion refina progresivamente los datos brutos en información utilizable. Bronze captura fotogramas continuos de 60 Hz. Silver es el catálogo de eventos: posesiones, tiros, bloqueos, emparejamientos defensivos, con rangos de fotogramas correlacionados con la salida de la cámara y la calibración de la arena aplicada. Gold es la capa de características listas para el análisis que impulsa los modelos y los paneles.

Gobernanza. Unity Catalog proporciona linaje, control de acceso y auditabilidad en todo el patrimonio de datos + IA. Eso es importante cuando los datos médicos se encuentran junto a los datos de rendimiento. Igualmente importante es la calidad y la confianza de los datos. El linaje y el monitoreo de la calidad permiten a un equipo probar qué etiquetas de eventos confían, qué calibración de la arena se desvió y qué modelo descendente se entrenó con qué alimentación. Ese tipo de procedencia es la precondición para basar decisiones reales en los datos, y la mayoría de los equipos no lo tienen hoy.

Análisis. Los modelos de ML como la probabilidad de tiro, el riesgo de lesión y el índice de fatiga se entrenan dentro de la misma plataforma. Model Serving los implementa. AI Search hace que el catálogo de video se pueda consultar por similitud, para que un entrenador pueda encontrar cada 3 disputado en el último cuarto contra una defensa cambiante sin tener que revisar manualmente la cinta. A través de una única interfaz, un equipo también puede acceder a cualquier modelo fundacional externo para tareas de visión y lenguaje como la detección de lesiones a partir de imágenes de transmisión o reemplazar sus propios modelos personalizados o de código abierto, un flujo de trabajo que ya utilizan los líderes de análisis en todos los deportes profesionales.

Servicio. Lakebase aporta latencia de consulta de subsegundos a la capa interactiva, para que las aplicaciones orientadas al analista y los paneles de control en la cancha no tengan que esperar a un almacén. Databricks Apps aloja aplicaciones de análisis personalizadas necesarias para equipos deportivos sofisticados: el visor biomecánico 3D, la aplicación de iPad junto a la cancha, la herramienta de evaluación de la oficina central. Se ejecutan en la misma plataforma gobernada que produce los datos, sin una pila de alojamiento separada.

game feed

Democratizar. Databricks Genie permite que entrenadores, preparadores físicos y personal de oficina hagan preguntas en lenguaje natural ("¿Cómo han cambiado las mecánicas de tiro de mis cinco titulares en el tercer cuarto contra defensas en zona en los últimos diez partidos?") y obtengan una respuesta “en el momento”. Los agentes de IA manejan los flujos de trabajo de varios pasos detrás de esas preguntas, ejecutando las uniones y agregaciones que antes requerían un analista disponible.

El objetivo es la componibilidad, no el reemplazo. Un equipo que ya tiene Hawk-Eye mantiene Hawk-Eye. Un equipo que ya tiene Catapult mantiene Catapult. El lakehouse hace que los resultados de esas inversiones sean interoperables, gobernados y lo suficientemente rápidos para su uso.

¿Qué se vuelve posible?

Tres resultados que vale la pena reflexionar. Hay más, pero estos son los que escuchamos con más frecuencia.

1. Prevención de Lesiones y Gestión de Carga

La disponibilidad de los jugadores es una prioridad máxima en todas las principales ligas deportivas, y las lesiones de jugadores de alto perfil acaparan los titulares tanto como las actuaciones dominantes. Hoy en día, la mayoría de los equipos reaccionan. Una estrella se lesiona en una jugada, el personal médico diagnostica, el jugador se pierde tiempo. Los datos para predecir (asimetrías biomecánicas, deltas de carga de aterrizaje, carga acumulada) existen en el feed. La plataforma para combinarlo entre proveedores no existe, en la mayoría de las organizaciones.

Con los datos esqueléticos de Hawk-Eye unificados con la carga de trabajo, el historial médico y el contexto jugada a jugada en una plataforma gobernada, los equipos pueden ver señales de advertencia que ningún sistema individual detecta por sí solo. Anomalías en el patrón de movimiento en los días previos a un desgarro del LCA. Asimetrías bilaterales que se correlacionan con el riesgo de Aquiles. Una carga acumulada de alta intensidad que cruza el umbral específico del jugador que le importa al personal médico. El cambio es de reactivo a proactivo, y esa es la conversación que el personal de entrenamiento puede tener con un entrenador principal y un gerente general con confianza.

2. Inteligencia de Entrenamiento en Tiempo Real

Durante un tiempo muerto, un asistente saca un iPad con el análisis del enfrentamiento actual. ¿Qué alineaciones están produciendo tiros eficientes contra la cobertura de cambios del oponente? ¿Cómo afecta la proximidad del defensor al punto de lanzamiento de nuestros tiradores? ¿Qué jugadas estamos ejecutando esta noche se ejecutan mecánicamente de manera limpia y cuáles se degradan en el último cuarto? ¿Cuánto está interrumpiendo un defensor específico las mecánicas de nuestra ofensiva, más allá de lo que muestra el box score?

Esa capacidad se asienta sobre un servicio de subsegundo y aplicaciones personalizadas, y requiere datos gobernados y limpios que los entrenadores y preparadores físicos puedan confiar en lo que ven. La mayoría de los entrenadores y preparadores físicos no escriben SQL. Genie hace que la interfaz sea en lenguaje natural. Las aplicaciones hacen que la experiencia esté diseñada para un propósito específico. Unity Catalog hace que las respuestas sean rastreables. La información impulsada por IA se vuelve accesible para cada miembro del personal que la necesita, al tiempo que brinda al equipo de análisis las herramientas para garantizar con confianza que esas respuestas sean confiables y estén disponibles de manera fiable.

Inteligencia de Entrenamiento en Tiempo Real

3. Experiencias Mejoradas para Aficionados y Transmisiones

El partido de Navidad de 2024 de la NBA fue la primera transmisión completamente animada de la liga basada en datos de SkeleTRACK. Esa fue la prueba de concepto. La plataforma hace que el modelo de producción sea real. Las cadenas pueden renderizar superposiciones biomecánicas en tiempo real durante los partidos en vivo. Los socios de fantasía y apuestas pueden consumir feeds gobernados y enriquecidos a través de Delta Sharing. Nuevos formatos (repeticiones 3D con contexto biomecánico, paquetes de highlights generados por IA, experiencias interactivas de segunda pantalla) se convierten en una cuestión de diseño en lugar de infraestructura.

El lakehouse que ejecuta el modelo de riesgo de lesiones es el mismo lakehouse que produce el feed de transmisión. Ese es el trabajo de la plataforma, y una organización deportiva debería esperar que la suya haga ambas cosas desde una única plataforma.

Baloncesto y Más Allá

El patrón se generaliza en todos los deportes con mucho seguimiento. Hawk-Eye en fútbol potencia el VAR, el fuera de juego semiautomático y el análisis táctico. La biomecánica de lanzamiento de KinaTrax en la MLB impulsa la prevención de lesiones del LCA, un problema de mil millones de dólares por sí solo. La mecánica del servicio de tenis, las acciones de lanzamiento de cricket y la próxima ola de seguimiento esquelético que llega a la NFL comparten la misma forma: datos espaciales de alta frecuencia, más video, más medicina, más contexto, unificados, gobernados y servidos rápidamente.

Los mismos patrones se extienden completamente fuera de los deportes. Captura de movimiento en atención médica, robótica de fabricación, percepción de vehículos autónomos. Dondequiera que un equipo tenga datos multimodales de alta frecuencia, el lakehouse proporciona la misma solución robusta y componible.

¿Qué Sigue?

Para los líderes en ciencia de datos, análisis y rendimiento, el seguimiento esquelético ya no es una hipótesis; o ya está aquí o está en camino. La única pregunta es si su plataforma está lista para ello.

Obtenga más información sobre Databricks para Medios y Entretenimiento, o solicite una demostración para ver cómo su organización puede generar información competitiva.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.