Ir para o conteúdo principal

Como o Databricks Ajuda Times de Baseball a Ganhar Vantagem com Dados e IA

Transformando dados de arremessos em decisões de dugout com Unity Catalog, Agent Bricks e Lakebase

How Databricks Helps Baseball Teams Gain an Edge with Data & AI

Publicado: 24 de março de 2026

Mídia e entretenimento8 min de leitura

Summary

  • Como um clube de beisebol usa IA na prática: o que o técnico de rebatidas, o técnico de arremessos, o gerente e o GM perguntam a um assistente ciente de contagem em situações reais.
  • Quais produtos Databricks potencializam cada momento: Genie em trabalhos de preparação e escritório, Agent Framework e Model Serving no dia do jogo, Unity Catalog e Vector Search por baixo, e Lakebase Postgres para aplicativos stateful.
  • Por que uma plataforma importa: os mesmos dados governados e ferramentas impulsionam decisões em tempo real, relatórios de scouting e estratégia de elenco, sem CSVs ou scripts pontuais.

O beisebol avança rápido, definido por pequenos momentos: um arremesso, um confronto, uma decisão. Esta história acompanha como um vestiário moderno usa o Databricks para transformar dados de arremessos de alta fidelidade em decisões que ajudam a vencer jogos.

Databricks para Beisebol

Dia de jogo, 14:00

Reunião de rebatedores com Genie e Unity Catalog

Os rebatedores entram na sala de vídeo. O técnico não quer uma impressão de 30 páginas; eles querem um plano claro para o arremessador titular de hoje à noite.

Mais cedo naquele dia, o analista sentou-se em seu laptop e abriu o Genie, sobre o Unity Catalog, onde tabelas Statcast e derivadas da equipe residem com esquemas, permissões e linhagem consistentes. Eles perguntaram:

“Para o arremessador titular de hoje à noite, mostre a mistura e as localizações do primeiro arremesso para nossos rebatedores destros e canhotos nas últimas duas temporadas. Destaque as tendências quando houver corredores em base.”

O Genie compilou a resposta de tabelas Delta governadas no Unity Catalog. Como parte desse trabalho, o analista também registrou um conjunto de funções SQL do Unity Catalog que encapsulam as consultas chave, como tendências por contagem, mão e estado do corredor em base, para que possam reutilizá-las em planejamento futuro e em agentes automatizados.

O analista exportou os resultados para um simples resumo de uma página que a equipe poderia imprimir ou incluir nos cadernos dos rebatedores. Os pontos chave foram:

  • Destros: muitos cutters e four-seamers no início, especialmente com bases vazias.
  • Canhotos: mais changeups e sinkers quando há um corredor na segunda base.
  • Duas strikes: slider para baixo e para fora aparece na maioria das eliminações por strikeout.

O técnico de rebatidas entra na reunião com três pontos de discussão claros. Quando os jogadores vão para o treino de rebatidas, as duas primeiras passagens pela ordem não são palpites; elas são baseadas em uma visão compartilhada de como o arremessador titular de hoje à noite realmente arremessa.

Preparação do bullpen pré-série

Roteirizando mudanças de arremesso com Agent Framework e Model Serving

A equipe sabe que haverá um momento na maioria dos jogos em que o arremessador titular estará perto de 100 arremessos e o meio da ordem estará vindo. A escolha entre um arremessador de sinkerball e um destro focado em slider parecerá uma decisão instintiva no momento, mas o trabalho acontece antes.

No vestiário antes da série, o analista usa um Multi-Agent Supervisor, construído com Agent Bricks e implantado no Model Serving, para simular os cenários que a equipe se importa: meio da ordem na sexta entrada, terço inferior na sétima, aglomerados com muitos canhotos nas entradas finais.

Para cada decisão, o agente:

  1. Resolve os nomes dos rebatedores relevantes para IDs usando uma função de consulta no Unity Catalog.
  2. Chama funções SQL do UC que computam resultados de tipo de arremesso e localização por contagem, mão e estado do corredor em base.
  3. Compara o arsenal de cada relevista com aquele grupo de rebatedores e explica quais perfis funcionam melhor e por quê, em linguagem de beisebol clara.

O analista transforma isso em um pequeno cartão de bullpen. Por exemplo:

  • “Se esses três rebatedores estiverem na ordem e o arremessador titular estiver cansando, o destro focado em slider é o preferido; aqui está como seu arsenal funcionou em cenários semelhantes.”
  • “Se o terço inferior estiver na ordem, o perfil de bola rasteira do arremessador de sinkerball vence com mais frequência; aqui estão as evidências.”

A equipe imprime o cartão e o revisa em conjunto. Quando a situação real da sexta entrada aparece durante o jogo, ninguém está logando no Databricks. O técnico de arremesso está seguindo uma árvore de decisão que a equipe já testou sob pressão com o agente horas antes.

Ofensiva nas entradas finais

Planejamento de decisões de pinch-hit com o mesmo agente e ferramentas

As escolhas de pinch-hit na oitava entrada são ensaiadas da mesma forma.

Como parte da preparação pré-jogo, o analista pergunta ao agente Databricks:

“Para os prováveis relevistas das entradas finais que veremos nesta série, classifique nossos rebatedores do banco por resultado esperado e explique quando cada um é a melhor opção.”

O agente chama as mesmas funções UC e tabelas Delta no Unity Catalog para:

  • Combinar o padrão de uso de cada relevista com os resultados de cada rebatedor do banco por tipo de arremesso, localização e contagem.
  • Simular cenários prováveis de final de jogo, como corredores na primeira e segunda bases, uma eliminação, enfrentando um relevista destro que usa cutters.
  • Produzir orientações diretas, como: “Contra o Relevista X, o Rebatedor A tem um perfil melhor com corredores em base, enquanto o Rebatedor B é mais adequado em situações de bases vazias quando ele usa sinkers.”

O analista insere essas recomendações no cartão de jogo do gerente ou em um pequeno resumo de uma página “grade de pinch-hit” que pode ser revisado com antecedência. Assim que o jogo começa, o cartão se torna o ponto de referência. O gerente está escolhendo entre opções que eles já analisaram, com os dados destilados em um formato que respeita as regras da liga sobre dispositivos no dugout.

Relatório

A inteligência de dados transforma indústrias

Dia de viagem

Scouting avançado com Vector Search e Unity Catalog

No dia de folga entre as séries, o analista passa das táticas de jogo único para o que está por vir. Dois arremessadores titulares futuros têm histórico direto limitado contra a escalação.

De volta ao Genie, eles perguntam:

“Encontre arremessadores cujos arsenais e perfis de movimento sejam mais semelhantes aos nossos arremessadores titulares futuros, em seguida, mostre como nossa escalação se saiu contra esses arremessadores comparáveis.”

Aqui, o Genie entrega parte do trabalho ao Databricks Vector Search. Embeddings de arremessadores e rebatedores, armazenados no Unity Catalog de processamento anterior, são indexados para que o sistema possa encontrar “arremessadores semelhantes” sem adivinhar.

O fluxo de trabalho é:

  1. O Genie analisa a mistura e o movimento de arremessos dos novos arremessadores titulares das tabelas do Unity Catalog.
  2. O Vector Search encontra arremessadores com perfis de arremesso semelhantes.
  3. Funções SQL do UC computam os resultados da escalação contra esses arremessadores comparáveis.
  4. O Genie resume os padrões em um relatório de scouting que o técnico de rebatidas pode usar.

Quando o histórico Statcast direto é escasso, essa combinação de Vector Search e Genie dá à equipe uma maneira de dizer: “É assim que batemos arremessadores que se parecem com isso” e incorporar isso ao plano da série. Essas percepções são então exportadas para o relatório avançado, pronto para a próxima reunião fora de casa.

Dia do front office

GM e analistas com Genie, Lakehouse e Lakebase

Temporadas vitoriosas são construídas com mais do que um jogo. O GM e os analistas usam a mesma plataforma para tomar decisões sobre valor, adequação e risco.

No Genie, eles exploram perguntas como:

“Mostre como o perfil do nosso terceiro arremessador titular se sai contra as principais escalações da nossa divisão por contagem e mão. De onde vem o valor dele e onde estamos expostos?”

“Para rebatedores canhotos em toda a liga, identifique jogadores cujos pontos fortes se alinham com a forma como nossa divisão é arremessada nas entradas finais.”

Essas perguntas são respondidas diretamente do lakehouse no Unity Catalog. Dados de nível de arremesso, embeddings e recursos derivados são todos governados em um só lugar. O Genie os transforma em respostas em linguagem natural, mas por baixo dos panos a lógica ainda são funções SQL do UC reutilizáveis.

Enquanto isso, o aplicativo de operações de beisebol que técnicos, olheiros e o front office usam é suportado pelo Lakebase Postgres. Esse aplicativo é onde:

  • Olheiros inserem relatórios sobre potenciais alvos de troca.
  • Técnicos marcam decisões de alto nível, como “Usou slider primeiro na sexta entrada contra o meio da ordem”, após o jogo.
  • O GM registra decisões finais sobre trocas, extensões e movimentos de elenco.

Como o Lakebase Postgres faz parte da plataforma Databricks, o estado do aplicativo é mantido próximo aos dados de origem:

  • Escritas do aplicativo (relatórios, tags, decisões) vão para o Lakebase Postgres e ficam imediatamente disponíveis para analistas e agentes que têm acesso.
  • Jobs agendados ou pipelines publicam fatias curadas de tabelas do Unity Catalog no Lakebase Postgres, para que a interface do usuário do aplicativo sempre tenha as estatísticas e recursos mais recentes sem exportações manuais de CSV.

O resultado é memória compartilhada. O que aconteceu, por que aconteceu e como foi justificado são armazenados em um só lugar, com carimbos de data/hora e identidade do usuário.

Por que isso ganha jogos

  • Apostas de elenco mais inteligentes: Movimentações de jogadores se alinham com a forma como a liga arremessa, especialmente na divisão e em outubro.
  • Aparelhos de plate de maior qualidade: Rebatedores focam no que um arremessador realmente arremessa naquele momento, não no que ele arremessa em geral.
  • Confrontos de bullpen mais limpos: As melhores situações de cada relevista são óbvias em segundos, reduzindo suposições sob pressão de tempo.
  • Menos arremessos desperdiçados em momentos cruciais: Saber o arremesso de finalização por rebatedor e contagem reduz contagens longas e walks.
  • Melhores resultados no primeiro arremesso: Planos de ataque que invertem escolhas esperadas criam contato inicial nos termos da equipe.

Tudo isso só importa se os números estiverem corretos. Ao executar esses agentes e aplicativos sobre um único lakehouse governado, em vez de ferramentas isoladas e pontuais, os clubes podem ver que a lógica corresponde ao trabalho que já fazem e confiar nela em momentos importantes. Quando os dados apontam para um confronto ou jogada específica, parece uma extensão do plano de jogo, não uma caixa preta.

Saiba mais sobre o Databricks Sports ou solicite uma demonstração para ver como sua organização pode gerar insights competitivos.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada