Publicado: 24 de março de 2026
por Nick Ragonese e Wesley Pasfield
O beisebol avança rápido, definido por pequenos momentos: um arremesso, um confronto, uma decisão. Esta história acompanha como um vestiário moderno usa o Databricks para transformar dados de arremessos de alta fidelidade em decisões que ajudam a vencer jogos.

Os rebatedores entram na sala de vídeo. O técnico não quer uma impressão de 30 páginas; eles querem um plano claro para o arremessador titular de hoje à noite.
Mais cedo naquele dia, o analista sentou-se em seu laptop e abriu o Genie, sobre o Unity Catalog, onde tabelas Statcast e derivadas da equipe residem com esquemas, permissões e linhagem consistentes. Eles perguntaram:
“Para o arremessador titular de hoje à noite, mostre a mistura e as localizações do primeiro arremesso para nossos rebatedores destros e canhotos nas últimas duas temporadas. Destaque as tendências quando houver corredores em base.”
O Genie compilou a resposta de tabelas Delta governadas no Unity Catalog. Como parte desse trabalho, o analista também registrou um conjunto de funções SQL do Unity Catalog que encapsulam as consultas chave, como tendências por contagem, mão e estado do corredor em base, para que possam reutilizá-las em planejamento futuro e em agentes automatizados.
O analista exportou os resultados para um simples resumo de uma página que a equipe poderia imprimir ou incluir nos cadernos dos rebatedores. Os pontos chave foram:
O técnico de rebatidas entra na reunião com três pontos de discussão claros. Quando os jogadores vão para o treino de rebatidas, as duas primeiras passagens pela ordem não são palpites; elas são baseadas em uma visão compartilhada de como o arremessador titular de hoje à noite realmente arremessa.
A equipe sabe que haverá um momento na maioria dos jogos em que o arremessador titular estará perto de 100 arremessos e o meio da ordem estará vindo. A escolha entre um arremessador de sinkerball e um destro focado em slider parecerá uma decisão instintiva no momento, mas o trabalho acontece antes.
No vestiário antes da série, o analista usa um Multi-Agent Supervisor, construído com Agent Bricks e implantado no Model Serving, para simular os cenários que a equipe se importa: meio da ordem na sexta entrada, terço inferior na sétima, aglomerados com muitos canhotos nas entradas finais.
Para cada decisão, o agente:
O analista transforma isso em um pequeno cartão de bullpen. Por exemplo:
A equipe imprime o cartão e o revisa em conjunto. Quando a situação real da sexta entrada aparece durante o jogo, ninguém está logando no Databricks. O técnico de arremesso está seguindo uma árvore de decisão que a equipe já testou sob pressão com o agente horas antes.
As escolhas de pinch-hit na oitava entrada são ensaiadas da mesma forma.
Como parte da preparação pré-jogo, o analista pergunta ao agente Databricks:
“Para os prováveis relevistas das entradas finais que veremos nesta série, classifique nossos rebatedores do banco por resultado esperado e explique quando cada um é a melhor opção.”
O agente chama as mesmas funções UC e tabelas Delta no Unity Catalog para:
O analista insere essas recomendações no cartão de jogo do gerente ou em um pequeno resumo de uma página “grade de pinch-hit” que pode ser revisado com antecedência. Assim que o jogo começa, o cartão se torna o ponto de referência. O gerente está escolhendo entre opções que eles já analisaram, com os dados destilados em um formato que respeita as regras da liga sobre dispositivos no dugout.
No dia de folga entre as séries, o analista passa das táticas de jogo único para o que está por vir. Dois arremessadores titulares futuros têm histórico direto limitado contra a escalação.
De volta ao Genie, eles perguntam:
“Encontre arremessadores cujos arsenais e perfis de movimento sejam mais semelhantes aos nossos arremessadores titulares futuros, em seguida, mostre como nossa escalação se saiu contra esses arremessadores comparáveis.”
Aqui, o Genie entrega parte do trabalho ao Databricks Vector Search. Embeddings de arremessadores e rebatedores, armazenados no Unity Catalog de processamento anterior, são indexados para que o sistema possa encontrar “arremessadores semelhantes” sem adivinhar.
O fluxo de trabalho é:
Quando o histórico Statcast direto é escasso, essa combinação de Vector Search e Genie dá à equipe uma maneira de dizer: “É assim que batemos arremessadores que se parecem com isso” e incorporar isso ao plano da série. Essas percepções são então exportadas para o relatório avançado, pronto para a próxima reunião fora de casa.
Temporadas vitoriosas são construídas com mais do que um jogo. O GM e os analistas usam a mesma plataforma para tomar decisões sobre valor, adequação e risco.
No Genie, eles exploram perguntas como:
“Mostre como o perfil do nosso terceiro arremessador titular se sai contra as principais escalações da nossa divisão por contagem e mão. De onde vem o valor dele e onde estamos expostos?”
“Para rebatedores canhotos em toda a liga, identifique jogadores cujos pontos fortes se alinham com a forma como nossa divisão é arremessada nas entradas finais.”
Essas perguntas são respondidas diretamente do lakehouse no Unity Catalog. Dados de nível de arremesso, embeddings e recursos derivados são todos governados em um só lugar. O Genie os transforma em respostas em linguagem natural, mas por baixo dos panos a lógica ainda são funções SQL do UC reutilizáveis.
Enquanto isso, o aplicativo de operações de beisebol que técnicos, olheiros e o front office usam é suportado pelo Lakebase Postgres. Esse aplicativo é onde:
Como o Lakebase Postgres faz parte da plataforma Databricks, o estado do aplicativo é mantido próximo aos dados de origem:
O resultado é memória compartilhada. O que aconteceu, por que aconteceu e como foi justificado são armazenados em um só lugar, com carimbos de data/hora e identidade do usuário.
Tudo isso só importa se os números estiverem corretos. Ao executar esses agentes e aplicativos sobre um único lakehouse governado, em vez de ferramentas isoladas e pontuais, os clubes podem ver que a lógica corresponde ao trabalho que já fazem e confiar nela em momentos importantes. Quando os dados apontam para um confronto ou jogada específica, parece uma extensão do plano de jogo, não uma caixa preta.
Saiba mais sobre o Databricks Sports ou solicite uma demonstração para ver como sua organização pode gerar insights competitivos.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
