Publicado: 24 de marzo de 2026
por Nick Ragonese y Wesley Pasfield
El béisbol avanza rápido, definido por pequeños momentos: un lanzamiento, un enfrentamiento, una decisión. Esta historia sigue cómo un vestuario moderno utiliza Databricks para convertir datos de lanzamientos de alta fidelidad en decisiones que ayudan a ganar partidos.

Los bateadores entran a la sala de video. El entrenador no quiere una impresión de 30 páginas; quiere un plan claro para el lanzador de esta noche.
Temprano ese día, el analista se sentó frente a su portátil y abrió Genie, sobre Unity Catalog, donde residen las tablas de Statcast y las tablas derivadas del equipo con esquemas, permisos y linaje consistentes. Preguntó:
“Para el lanzador de esta noche, muestra la mezcla y las ubicaciones del primer lanzamiento a nuestros bateadores diestros y zurdos durante las últimas dos temporadas. Destaca las tendencias cuando hay corredores en base.”
Genie compiló la respuesta a partir de tablas Delta gobernadas en Unity Catalog. Como parte de ese trabajo, el analista también registró un conjunto de funciones SQL de Unity Catalog que encapsulan las consultas clave, como las tendencias por conteo, mano y estado del corredor en base, para poder reutilizarlas en la planificación futura y en agentes automatizados.
El analista exportó los resultados a un simple documento de una página que el personal podía imprimir o incluir en las carpetas de los bateadores. Los puntos clave fueron:
El entrenador de bateo entra a la reunión con tres puntos clave claros. Para cuando los jugadores se dirigen a la práctica de bateo, los dos primeros turnos al bate no son suposiciones; están anclados en una visión compartida de cómo lanza realmente el lanzador de esta noche.
El personal sabe que llegará un momento en la mayoría de los partidos en que el lanzador estará cerca de los 100 lanzamientos y se acercará el corazón del orden. La elección entre un lanzador de sinkerball o un diestro que lanza slider se sentirá como una decisión instintiva en el momento, pero el trabajo se realiza antes.
En el vestuario antes de la serie, el analista utiliza un Multi-Agent Supervisor, construido con Agent Bricks y desplegado en Model Serving, para simular los escenarios que preocupan al personal: el corazón del orden en la sexta entrada, la parte baja del orden en la séptima, grupos con muchos zurdos en las últimas entradas.
Para cada decisión, el agente:
El analista convierte esto en una breve tarjeta de bullpen. Por ejemplo:
El personal imprime la tarjeta y la revisa junta. Cuando aparece la situación real de la sexta entrada durante el partido, nadie está iniciando sesión en Databricks. El entrenador de lanzadores está siguiendo un árbol de decisiones que el personal ya probó con el agente horas antes.
Las elecciones de bateadores emergentes en la octava entrada se ensayan de la misma manera.
Como parte de la preparación previa al partido, el analista le pregunta al agente de Databricks:
“Para los relevistas probables de las últimas entradas que veremos en esta serie, clasifica a nuestros bateadores de banca por resultado esperado y explica cuándo cada uno es la mejor opción.”
El agente llama a las mismas funciones de UC y tablas Delta en Unity Catalog para:
El analista incluye estas recomendaciones en la tarjeta de partido del mánager o en una pequeña cuadrícula de bateo emergente de una página que se puede revisar con antelación. Una vez que comienza el partido, la tarjeta se convierte en el punto de referencia. El mánager está eligiendo entre opciones que ya ha repasado, con los datos destilados en un formato que respeta las reglas de la liga sobre dispositivos en el dugout.
En el día libre entre series, el analista pasa de las tácticas de un solo partido a lo que viene. Dos lanzadores próximos tienen poca historia directa contra la alineación.
De vuelta en Genie, pregunta:
“Encuentra lanzadores cuyos arsenales y perfiles de movimiento sean más similares a nuestros lanzadores próximos, luego muestra cómo le ha ido a nuestra alineación contra esos lanzadores comparables.”
Aquí, Genie le entrega parte del trabajo a Databricks Vector Search. Los embeddings de lanzadores y bateadores, almacenados en Unity Catalog de procesamientos anteriores, se indexan para que el sistema pueda encontrar “lanzadores similares” sin adivinar a ojo.
El flujo de trabajo es:
Cuando el historial directo de Statcast es escaso, esta combinación de Vector Search y Genie le da al personal una forma de decir: “Así es como hemos bateado contra lanzadores que se parecen a este”, y lo integra en el plan de la serie. Esos conocimientos se exportan luego al informe de exploración, listo para la próxima reunión fuera de casa.
Las temporadas ganadoras se construyen con más que un solo partido. El gerente general y los analistas utilizan la misma plataforma para tomar decisiones sobre valor, ajuste y riesgo.
En Genie, exploran preguntas como:
“Muestra cómo el perfil de nuestro tercer lanzador funciona contra las alineaciones principales de nuestra división por conteo y mano. ¿De dónde proviene su valor y dónde estamos expuestos?”
“Para los bateadores zurdos de la liga, identifica jugadores cuyas fortalezas coincidan con cómo se lanza en nuestra división en las últimas entradas.”
Estas preguntas se responden directamente desde el lakehouse en Unity Catalog. Los datos a nivel de lanzamiento, los embeddings y las características derivadas se rigen en un solo lugar. Genie los convierte en respuestas en lenguaje natural, pero bajo la superficie la lógica sigue siendo funciones SQL de UC reutilizables.
Mientras tanto, la aplicación de operaciones de béisbol que utilizan entrenadores, scouts y la oficina principal está respaldada por Lakebase Postgres. Esa aplicación es donde:
Dado que Lakebase Postgres es parte de la plataforma Databricks, el estado de la aplicación se mantiene cerca de los datos de origen:
El resultado es una memoria compartida. Lo que sucedió, por qué sucedió y cómo se justificó se almacena en un solo lugar, con marcas de tiempo e identidad de usuario.
Todo eso solo importa si los números son correctos. Al ejecutar estos agentes y aplicaciones sobre un único lakehouse gobernado en lugar de herramientas dispersas y únicas, los clubes pueden ver que la lógica coincide con el trabajo que ya realizan y confiar en ella en momentos importantes. Cuando los datos apuntan a un enfrentamiento o movimiento específico, se siente como una extensión del plan de juego, no como una caja negra.
Obtenga más información sobre Databricks Sports, o solicite una demostración para ver cómo su organización puede generar información competitiva.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
