Ir para o conteúdo principal
Setores

A Ascensão da Inteligência Esportiva: Como o Lakehouse Transforma Dados de Rastreamento em Vantagem Competitiva

Uma base moderna de dados e IA que conecta rastreamento de jogadores, biomecânica e operações a decisões em quadra e no escritório.

por Corey Abshire, Kush Patel e Nick Ragonese

  • Mostre como equipes profissionais transformam dados explosivos de rastreamento e biomecânica (como o Hawk‑Eye SkeleTRACK da NBA) em inteligência esportiva que realmente muda decisões em quadra, na sala de treinamento e no escritório.
  • Use a Plataforma de Inteligência de Dados Databricks como o “cérebro esportivo” governado, onde dados de rastreamento, médicos, vestíveis, vídeo, olheiros e fãs chegam a um único lakehouse, em seguida, aplique Lakeflow, Unity Catalog, ML, AI Search e aplicativos de subsegundo para potencializar fluxos de trabalho em tempo real.
  • Destaques de resultados concretos: gerenciamento proativo de lesões e carga de trabalho, insights de treinamento em tempo real sobre confrontos e mecânicas, e experiências de fãs e transmissão de próxima geração, como sobreposições biomecânicas e replays interativos e orientados por dados.

Cada segundo de um jogo profissional de basquete agora gera mais de 20.000 pontos de dados de câmeras Hawk-Eye. Em um jogo de 48 minutos, isso soma dezenas de milhões de medições de posição. Em algum lugar dentro desse fluxo estão as respostas para as perguntas que as equipes obcecam: como prevenir lesões, observar com mais precisão, dissecar jogadas, otimizar escalações e até mesmo ajustar a mecânica de arremesso. A parte difícil é construir as plataformas de dados e os modelos de IA que respondem a essas perguntas de forma confiável e em escala. Esses sistemas precisam ser rápidos o suficiente para mudar o que acontece na quadra, no vestiário e no escritório.

Em todos os esportes profissionais, o volume de dados biomecânicos e de rastreamento nunca foi tão alto. No entanto, a capacidade da maioria das organizações de realmente usar esses dados para resolver seus principais casos de uso mal se moveu. A Plataforma de Inteligência de Dados Databricks ajuda as equipes de dados esportivos a preencher essa lacuna, criando uma oportunidade para as equipes criarem novas capacidades de Inteligência Esportiva para seus jogadores e treinadores, permitindo que eles finalmente desbloqueiem o valor nessa quantidade massiva de dados. A Databricks ajuda as equipes a manter os jogadores mais saudáveis, vencer mais jogos, impulsionar o desempenho e operar com mais eficiência em todo o seu ecossistema.

A Explosão de Dados

Em março de 2023, a NBA substituiu o rastreamento de jogadores de centro de massa da Second Spectrum pelo sistema SkeleTRACK da Sony Hawk-Eye em todas as 29 arenas. O novo feed captura 29 articulações esqueléticas em cada jogador e árbitro, 13 pessoas na quadra a qualquer momento, amostrado 60 vezes por segundo. Isso equivale a aproximadamente 22.620 atualizações de posição por segundo, na ordem de 65 milhões de registros por jogo de 48 minutos, e aproximadamente 80 bilhões de registros em uma temporada regular de 82 jogos antes de contar os playoffs ou treinos.

Este é um salto geracional, com os dados SkeleTRACK sendo aproximadamente duas ordens de magnitude mais ricos e, pela primeira vez, capturando pose 3D completa em tempo real. O que os dados desbloqueiam não é "detecção de objetos" ou "visão computacional". Esses são os meios. Os resultados reais são as coisas com que as equipes se importam:

  • Entender como a mecânica de um arremessador muda no final do jogo, à medida que a fadiga altera o ângulo do cotovelo e a altura de lançamento.
  • Detectar mudanças sutis nos padrões de movimento que precedem lesões no LCA e no tendão de Aquiles.
  • Quantificar como esquemas defensivos, proximidade do defensor e a jogada específica executada alteram a precisão do arremesso.
  • Comparar a carga biomecânica entre os jogos para otimizar decisões de descanso e reduzir lesões.
  • Personalizar o desenvolvimento de habilidades mapeando a mecânica única de cada atleta para seus resultados de acerto/erro, em vez de forçar um modelo de treinamento genérico.
  • Projetar perfis de movimento específicos para função e posição, para que as equipes possam recrutar, trocar e desenvolver jogadores cujas biomecânicas se encaixem em seu sistema.

A camada de rastreamento também está se consolidando em todos os esportes. Hawk-Eye já está implantado na Premier League, todos os quatro Grand Slams de tênis, DRS do Críquete, Statcast da MLB, NASCAR e Fórmula 1. A NHL expandiu sua parceria de rastreamento de puck e jogadores, com a extensão biomecânica sendo o próximo passo óbvio, e a NFL está seguindo de perto. Qualquer base que uma organização esportiva construa para Hawk-Eye em um esporte servirá em todos os esportes que ela pratica.

Hawk-Eye fornece o feed para as equipes. Ele não fornece as respostas para as equipes. A questão é: o que você faz com ele?

A Lacuna de Integração

Dentro de uma organização esportiva profissional moderna, a pilha de análise é frequentemente distribuída entre componentes de vários fornecedores. Dados de rastreamento vivem com um fornecedor, wearables com outro, vídeo em outro lugar, observação de adversários e rótulos de eventos com um provedor diferente, e análise de lesões com outro. Quando combinados com a escala dos dados envolvidos, isso pode levar a vários desafios em toda a indústria.

  • Silos de "verdade". A equipe de desempenho, a equipe médica e a equipe de treinamento trabalham com sua própria "versão" (muitas vezes conflitante) dos mesmos dados do jogador, com a reconciliação levando semanas.
  • Latência que se acumula. Cada etapa entre os fornecedores introduz atraso. Algumas perguntas precisam de respostas em tempo real no banco, outras só precisam estar lá pela manhã a um custo razoável, mas a maioria das equipes luta para atingir qualquer um deles de forma confiável.
  • Sem governança e sem rótulos confiáveis. Quem tem acesso a quê? Você pode rastrear uma previsão até o prontuário médico, o arquivo do wearable e o quadro da câmera que a gerou? Você pode confiar em um rótulo de evento de um fornecedor externo quando sabe que ele está errado em alguns momentos? A maioria das equipes continua usando esses rótulos de qualquer maneira, ciente dos problemas, mas limitada pelas ferramentas que possui hoje.
  • Reconciliação de arena. Posições de câmera, geometria da quadra e desvio de calibração diferem entre os locais. Mesmo a saída bruta do Hawk-Eye requer normalização antes de ser comparável de jogo para jogo.
  • Computação que não escala. 953.000 quadros por jogo levam as tabelas tradicionais de data warehouse para além do limite da praticidade. As equipes de ciência de dados esportivos rotineiramente recorrem ao Python local em um laptop, baixando amostras e esperando que a amostra seja representativa.

Esses não são problemas que outra solução pontual resolverá. O custo da fragmentação se manifesta em sinais de lesão perdidos, decisões mais lentas durante o jogo e incapacidade de realizar análises verdadeiras entre domínios que combinam dados de rastreamento com histórico médico, carga de trabalho e tendências do adversário. A peça que falta não é outra ferramenta. O que as equipes precisam é de uma plataforma de dados e IA governada onde todas essas ferramentas e fluxos de dados possam convergir.

Sports Intelligence no Lakehouse

A Plataforma de Inteligência de Dados Databricks é o centro composível onde os sistemas de rastreamento, wearables, vídeo, observação, médicos, operacionais e de engajamento de fãs de uma organização convergem em um único ambiente governado. Ela fornece à equipe a base para transformar as saídas desses sistemas em algo utilizável por um treinador em um tempo limite, um biomecânico em um laboratório e um GM no prazo de negociação.

Sports Intelligence on the Lakehouse

Visão Geral de Alto Nível:

Ingerir. Lakeflow lida com a ingestão de streaming de feeds Hawk-Eye, wearables e de eventos na velocidade do jogo. Auto Loader e pipelines declarativos permitem que as equipes configurem a ingestão de produção sem escrever Spark personalizado manualmente. Isso é importante em uma indústria onde a organização de análise geralmente é composta por um punhado de pessoas.

Organizar. Uma arquitetura medallion refina progressivamente os dados brutos em insights utilizáveis. Bronze captura quadros contínuos de 60 Hz. Silver é o catálogo de eventos: posses, arremessos, bloqueios, confrontos defensivos, com intervalos de quadros correlacionados à saída da câmera e calibração da arena aplicada. Gold é a camada de recursos pronta para análise que impulsiona os modelos e dashboards.

Governar. Unity Catalog fornece linhagem, controle de acesso e auditabilidade em todo o ambiente de dados + IA. Isso é importante quando dados médicos ficam ao lado de dados de desempenho. Igualmente importante é a qualidade e a confiança dos dados. A linhagem e o monitoramento de qualidade permitem que uma equipe prove quais rótulos de eventos eles confiam, qual a calibração da arena se desviou e qual modelo downstream foi treinado em qual feed. Esse tipo de proveniência é o pré-requisito para basear decisões reais nos dados, e a maioria das equipes não o possui hoje.

Analisar. Modelos de ML como probabilidade de arremesso, risco de lesão e índice de fadiga treinam dentro da mesma plataforma. Model Serving os implanta. AI Search torna o catálogo de vídeo consultável por similaridade, para que um treinador possa encontrar todos os 3 pontos contestados no quarto período contra uma defesa de troca sem ter que vasculhar fitas manualmente. Através de uma única interface, uma equipe também pode acessar qualquer modelo fundacional externo para tarefas de visão-linguagem, como detecção de lesões a partir de filmagens de transmissão ou substituir seus próprios modelos personalizados ou de código aberto, um fluxo de trabalho já em uso por líderes de análise em esportes profissionais.

Servir. Lakebase traz latência de consulta de subsegundo para a camada interativa, para que aplicativos voltados para analistas e dashboards à beira da quadra não precisem esperar por um data warehouse. Databricks Apps hospeda aplicativos de análise personalizados necessários por equipes esportivas sofisticadas: o visualizador biomecânico 3D, o aplicativo de iPad ao lado da quadra, a ferramenta de avaliação do front office. Eles rodam na mesma plataforma governada que produz os dados, sem uma pilha de hospedagem separada.

game feed

Democratize. Databricks Genie permite que treinadores, preparadores físicos e a equipe de gestão façam perguntas em linguagem natural ("Como as mecânicas de arremesso dos meus cinco titulares mudaram em relação à defesa por zona nos últimos dez jogos?") e obtenham uma resposta "no momento". Agentes de IA lidam com os fluxos de trabalho de várias etapas por trás dessas perguntas, executando as junções e agregações que antes exigiam um analista de plantão.

O ponto é a composibilidade, não a substituição. Uma equipe que já tem Hawk-Eye mantém o Hawk-Eye. Uma equipe que já tem Catapult mantém o Catapult. O lakehouse torna os resultados desses investimentos interoperáveis, governados e rápidos o suficiente para serem usados.

O Que Se Torna Possível

Três resultados que valem a reflexão. Existem outros, mas estes são os que ouvimos com mais frequência.

1. Prevenção de Lesões e Gerenciamento de Carga

A disponibilidade do jogador é uma prioridade máxima em todas as principais ligas esportivas, com lesões de jogadores de destaque ganhando as manchetes tanto quanto atuações dominantes. Hoje, a maioria das equipes reage. Um craque se machuca em uma jogada, a equipe médica diagnostica, o jogador fica fora. Os dados para prever (assimetrias biomecânicas, deltas de carga de aterrissagem, carga de trabalho cumulativa) existem no feed. A plataforma para combiná-los entre fornecedores não existe, na maioria das organizações.

Com os dados esqueléticos do Hawk-Eye unificados com a carga de trabalho, histórico médico e contexto de jogada a jogada em uma plataforma governada, as equipes podem ver sinais de alerta que nenhum sistema isolado detecta sozinho. Anomalias no padrão de movimento nos dias anteriores a uma lesão no LCA. Assimetrias bilaterais que acompanham o risco de tendão de Aquiles. Uma carga cumulativa de alta intensidade que ultrapassa o limite específico do jogador que a equipe médica considera importante. A mudança é de reativa para proativa, e essa é a conversa que a equipe de treinamento pode ter com um treinador principal e um GM com confiança.

2. Inteligência de Treinamento em Tempo Real

Durante um tempo limite, um assistente abre um iPad com a análise do confronto atual. Quais formações estão produzindo arremessos eficientes contra a cobertura de troca do adversário? Como a proximidade do defensor está afetando o ponto de lançamento dos nossos arremessadores? Quais jogadas que estamos executando hoje estão sendo mecanicamente bem executadas, e quais estão se degradando no quarto período? Quanto um defensor específico está perturbando a mecânica do nosso ataque, além do que o placar mostra?

Essa capacidade fica no topo de um serviço de subsegundo e aplicativos personalizados, e requer dados governados e limpos o suficiente para que treinadores e preparadores físicos possam confiar no que veem. A maioria dos treinadores e preparadores físicos não escreve SQL. Genie torna a interface em linguagem natural. Aplicativos tornam a experiência específica para o propósito. Unity Catalog torna as respostas rastreáveis. Insights impulsionados por IA se tornam disponíveis para todos os membros da equipe que precisam deles, ao mesmo tempo em que dão à equipe de análise as ferramentas para garantir com confiança que essas respostas sejam confiáveis e estejam disponíveis de forma confiável.

Inteligência de Treinamento em Tempo Real

3. Experiências Aprimoradas para Fãs e Transmissões

O jogo de Natal de 2024 da NBA foi a primeira transmissão totalmente animada da liga, construída com dados do SkeleTRACK. Essa foi a prova de conceito. A plataforma torna o modelo de produção real. As emissoras podem renderizar sobreposições biomecânicas em tempo real durante jogos ao vivo. Parceiros de fantasy e apostas podem consumir feeds governados e enriquecidos via Delta Sharing. Novos formatos (replay 3D com contexto biomecânico, pacotes de melhores momentos gerados por IA, experiências interativas de segunda tela) se tornam uma questão de design, não de infraestrutura.

O lakehouse que executa o modelo de risco de lesões é o mesmo lakehouse que produz o feed de transmissão. Esse é o trabalho da plataforma, e uma organização esportiva deve esperar que a sua faça ambos a partir de um único ambiente.

Basquete e Além

O padrão se generaliza em todos os esportes com muitos dados de rastreamento. Hawk-Eye no futebol impulsiona o VAR, o impedimento semi-automático e a análise tática. A biomecânica de arremesso do KinaTrax na MLB impulsiona a prevenção de lesões no LCA, um problema de bilhões de dólares por si só. Mecânicas de saque no tênis, ações de arremesso no críquete e a próxima onda de rastreamento esquelético chegando à NFL compartilham a mesma forma: dados espaciais de alta frequência, mais vídeo, mais dados médicos, mais contexto, unificados, governados e servidos rapidamente.

Os mesmos padrões se estendem completamente para fora dos esportes. Captura de movimento em saúde, robótica industrial, percepção de veículos autônomos. Onde quer que uma equipe tenha dados multimodais de alta frequência, o lakehouse fornece a mesma solução robusta e composível.

E Agora?

Para líderes em ciência de dados, análise e desempenho, o rastreamento esquelético não é mais uma hipótese; já está aqui ou a caminho. A única questão é se sua plataforma está pronta para isso.

Saiba mais sobre Databricks para Mídia e Entretenimento, ou solicite uma demonstração para ver como sua organização pode gerar insights competitivos.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.