Ir al contenido principal

Cómo Databricks ayuda a los equipos de béisbol a obtener una ventaja con datos e IA

Convirtiendo datos de pitcheo en decisiones de dugout con Unity Catalog, Agent Bricks y Lakebase

How Databricks Helps Baseball Teams Gain an Edge with Data & AI

Publicado: 24 de marzo de 2026

Medios y entretenimiento8 min de lectura

Summary

  • Cómo un club de béisbol utiliza la IA en la práctica: lo que el entrenador de bateo, el entrenador de pitcheo, el mánager y el gerente general le preguntan a un asistente consciente del conteo en situaciones reales.
  • Qué productos de Databricks potencian cada momento: Genie en la preparación y el trabajo de oficina, Agent Framework y Model Serving en el día del partido, Unity Catalog y Vector Search debajo, y Lakebase Postgres para aplicaciones con estado.
  • Por qué una plataforma importa: los mismos datos y herramientas gobernados impulsan decisiones en tiempo real, informes de exploración y estrategia de roster, sin CSV ni scripts únicos.

El béisbol avanza rápido, definido por pequeños momentos: un lanzamiento, un enfrentamiento, una decisión. Esta historia sigue cómo un vestuario moderno utiliza Databricks para convertir datos de lanzamientos de alta fidelidad en decisiones que ayudan a ganar partidos.

Databricks para Béisbol

Día de partido, 2:00 PM

Reunión de bateadores con Genie y Unity Catalog

Los bateadores entran a la sala de video. El entrenador no quiere una impresión de 30 páginas; quiere un plan claro para el lanzador de esta noche.

Temprano ese día, el analista se sentó frente a su portátil y abrió Genie, sobre Unity Catalog, donde residen las tablas de Statcast y las tablas derivadas del equipo con esquemas, permisos y linaje consistentes. Preguntó:

“Para el lanzador de esta noche, muestra la mezcla y las ubicaciones del primer lanzamiento a nuestros bateadores diestros y zurdos durante las últimas dos temporadas. Destaca las tendencias cuando hay corredores en base.”

Genie compiló la respuesta a partir de tablas Delta gobernadas en Unity Catalog. Como parte de ese trabajo, el analista también registró un conjunto de funciones SQL de Unity Catalog que encapsulan las consultas clave, como las tendencias por conteo, mano y estado del corredor en base, para poder reutilizarlas en la planificación futura y en agentes automatizados.

El analista exportó los resultados a un simple documento de una página que el personal podía imprimir o incluir en las carpetas de los bateadores. Los puntos clave fueron:

  • Diestros: muchos cutters y four-seamers al principio, especialmente con bases vacías.
  • Zurdos: más changeups y sinkers cuando hay un corredor en segunda.
  • Dos strikes: el slider hacia abajo y afuera aparece en la mayoría de los ponches importantes.

El entrenador de bateo entra a la reunión con tres puntos clave claros. Para cuando los jugadores se dirigen a la práctica de bateo, los dos primeros turnos al bate no son suposiciones; están anclados en una visión compartida de cómo lanza realmente el lanzador de esta noche.

Preparación del bullpen antes de la serie

Guionización de cambios de lanzador con Agent Framework y Model Serving

El personal sabe que llegará un momento en la mayoría de los partidos en que el lanzador estará cerca de los 100 lanzamientos y se acercará el corazón del orden. La elección entre un lanzador de sinkerball o un diestro que lanza slider se sentirá como una decisión instintiva en el momento, pero el trabajo se realiza antes.

En el vestuario antes de la serie, el analista utiliza un Multi-Agent Supervisor, construido con Agent Bricks y desplegado en Model Serving, para simular los escenarios que preocupan al personal: el corazón del orden en la sexta entrada, la parte baja del orden en la séptima, grupos con muchos zurdos en las últimas entradas.

Para cada decisión, el agente:

  1. Resuelve los nombres de los bateadores relevantes a IDs utilizando una función de búsqueda en Unity Catalog.
  2. Llama a funciones SQL de UC que calculan los resultados de tipo de lanzamiento y ubicación por conteo, mano y estado del corredor en base.
  3. Compara el arsenal de cada relevista con ese grupo de bateadores y explica qué perfiles funcionan mejor y por qué, en lenguaje de béisbol claro.

El analista convierte esto en una breve tarjeta de bullpen. Por ejemplo:

  • “Si estos tres bateadores están por salir y el lanzador se está cansando, el lanzador diestro de slider es el favorecido; así es como su mezcla ha funcionado en escenarios similares.”
  • “Si la parte baja del orden está por salir, el perfil de roletazo del lanzador de sinkerball gana más a menudo; aquí está la evidencia.”

El personal imprime la tarjeta y la revisa junta. Cuando aparece la situación real de la sexta entrada durante el partido, nadie está iniciando sesión en Databricks. El entrenador de lanzadores está siguiendo un árbol de decisiones que el personal ya probó con el agente horas antes.

Ofensiva en las últimas entradas

Planificación de decisiones de bateo emergente con el mismo agente y herramientas

Las elecciones de bateadores emergentes en la octava entrada se ensayan de la misma manera.

Como parte de la preparación previa al partido, el analista le pregunta al agente de Databricks:

“Para los relevistas probables de las últimas entradas que veremos en esta serie, clasifica a nuestros bateadores de banca por resultado esperado y explica cuándo cada uno es la mejor opción.”

El agente llama a las mismas funciones de UC y tablas Delta en Unity Catalog para:

  • Combinar el patrón de uso de cada relevista con los resultados de cada bateador de banca por tipo de lanzamiento, ubicación y conteo.
  • Simular escenarios probables de final de partido, como corredores en primera y segunda, un out, enfrentando a un relevista diestro que se apoya en cutters.
  • Producir orientación sencilla, como: “Contra el Relevista X, el Bateador A tiene un mejor perfil con corredores en base, mientras que el Bateador B encaja mejor en situaciones de bases vacías cuando él se apoya en sinkers.”

El analista incluye estas recomendaciones en la tarjeta de partido del mánager o en una pequeña cuadrícula de bateo emergente de una página que se puede revisar con antelación. Una vez que comienza el partido, la tarjeta se convierte en el punto de referencia. El mánager está eligiendo entre opciones que ya ha repasado, con los datos destilados en un formato que respeta las reglas de la liga sobre dispositivos en el dugout.

Informe

La inteligencia de datos remodela las industrias

Día de viaje

Exploración avanzada con Vector Search y Unity Catalog

En el día libre entre series, el analista pasa de las tácticas de un solo partido a lo que viene. Dos lanzadores próximos tienen poca historia directa contra la alineación.

De vuelta en Genie, pregunta:

“Encuentra lanzadores cuyos arsenales y perfiles de movimiento sean más similares a nuestros lanzadores próximos, luego muestra cómo le ha ido a nuestra alineación contra esos lanzadores comparables.”

Aquí, Genie le entrega parte del trabajo a Databricks Vector Search. Los embeddings de lanzadores y bateadores, almacenados en Unity Catalog de procesamientos anteriores, se indexan para que el sistema pueda encontrar “lanzadores similares” sin adivinar a ojo.

El flujo de trabajo es:

  1. Genie analiza la mezcla y el movimiento de lanzamientos de los nuevos lanzadores a partir de las tablas de Unity Catalog.
  2. Vector Search encuentra lanzadores con perfiles de lanzamiento similares.
  3. Las funciones SQL de UC calculan los resultados de la alineación contra esos lanzadores comparables.
  4. Genie resume los patrones en un informe de exploración que el entrenador de bateo puede utilizar.

Cuando el historial directo de Statcast es escaso, esta combinación de Vector Search y Genie le da al personal una forma de decir: “Así es como hemos bateado contra lanzadores que se parecen a este”, y lo integra en el plan de la serie. Esos conocimientos se exportan luego al informe de exploración, listo para la próxima reunión fuera de casa.

Día de oficina principal

Gerente general y analistas con Genie, Lakehouse y Lakebase

Las temporadas ganadoras se construyen con más que un solo partido. El gerente general y los analistas utilizan la misma plataforma para tomar decisiones sobre valor, ajuste y riesgo.

En Genie, exploran preguntas como:

“Muestra cómo el perfil de nuestro tercer lanzador funciona contra las alineaciones principales de nuestra división por conteo y mano. ¿De dónde proviene su valor y dónde estamos expuestos?”

“Para los bateadores zurdos de la liga, identifica jugadores cuyas fortalezas coincidan con cómo se lanza en nuestra división en las últimas entradas.”

Estas preguntas se responden directamente desde el lakehouse en Unity Catalog. Los datos a nivel de lanzamiento, los embeddings y las características derivadas se rigen en un solo lugar. Genie los convierte en respuestas en lenguaje natural, pero bajo la superficie la lógica sigue siendo funciones SQL de UC reutilizables.

Mientras tanto, la aplicación de operaciones de béisbol que utilizan entrenadores, scouts y la oficina principal está respaldada por Lakebase Postgres. Esa aplicación es donde:

  • Los scouts ingresan informes sobre posibles objetivos de intercambio.
  • Los entrenadores etiquetan decisiones de alto nivel, como “Se usó slider primero en la sexta entrada contra el corazón del orden”, después del partido.
  • El gerente general registra las decisiones finales sobre intercambios, extensiones y movimientos de roster.

Dado que Lakebase Postgres es parte de la plataforma Databricks, el estado de la aplicación se mantiene cerca de los datos de origen:

  • Las escrituras de la aplicación (informes, etiquetas, decisiones) van a Lakebase Postgres y están disponibles inmediatamente para los analistas y agentes que tienen acceso.
  • Los trabajos programados o las canalizaciones publican porciones curadas de tablas de Unity Catalog en Lakebase Postgres, de modo que la interfaz de usuario de la aplicación siempre tenga las últimas estadísticas y características sin exportaciones manuales de CSV.

El resultado es una memoria compartida. Lo que sucedió, por qué sucedió y cómo se justificó se almacena en un solo lugar, con marcas de tiempo e identidad de usuario.

Por qué esto gana partidos

  • Apuestas de roster más inteligentes: los movimientos de jugadores se alinean con cómo se lanza en la liga, especialmente en la división y en octubre.
  • Apariciones en el plato de mayor calidad: los bateadores se centran en lo que un lanzador realmente lanza en ese momento, no en lo que lanza en general.
  • Emparejamientos de bullpen más limpios: las mejores situaciones de cada relevista son obvias en segundos, lo que reduce las conjeturas bajo presión de tiempo.
  • Menos lanzamientos desperdiciados en momentos clave: conocer el lanzamiento decisivo por bateador y conteo reduce los conteos largos y las bases por bolas.
  • Mejores resultados en el primer lanzamiento: los planes de ataque que invierten las opciones esperadas crean contacto temprano en los términos del equipo.

Todo eso solo importa si los números son correctos. Al ejecutar estos agentes y aplicaciones sobre un único lakehouse gobernado en lugar de herramientas dispersas y únicas, los clubes pueden ver que la lógica coincide con el trabajo que ya realizan y confiar en ella en momentos importantes. Cuando los datos apuntan a un enfrentamiento o movimiento específico, se siente como una extensión del plan de juego, no como una caja negra.

Obtenga más información sobre Databricks Sports, o solicite una demostración para ver cómo su organización puede generar información competitiva.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.