Revenir au contenu principal
Industries

L'essor de l'intelligence sportive : comment le Lakehouse transforme les données de suivi en avantage concurrentiel

Une base moderne de données et d'IA qui connecte le suivi des joueurs, la biomécanique et les opérations aux décisions sur le terrain et au sein de la direction.

par Corey Abshire, Kush Patel et Nick Ragonese

  • Montrez comment les équipes professionnelles transforment les données explosives de suivi et de biomécanique (comme le SkeleTRACK de Hawk-Eye de la NBA) en intelligence sportive qui modifie réellement les décisions sur le terrain, dans la salle d'entraînement et au sein de la direction.
  • Utilisez la plateforme d'intelligence de données Databricks comme "cerveau sportif" gouverné où les données de suivi, médicales, portables, vidéo, de recrutement et des fans atterrissent dans un seul lakehouse, puis appliquez Lakeflow, Unity Catalog, ML, AI Search et des applications sub-secondes pour alimenter des flux de travail en temps réel.
  • Met en évidence les résultats concrets : gestion proactive des blessures et de la charge de travail, informations en temps réel pour l'entraînement sur les confrontations et la mécanique, et expériences de nouvelle génération pour les fans et la diffusion comme les superpositions biomécaniques et les relectures interactives basées sur les données.

Chaque seconde d'un match de basketball professionnel génère désormais plus de 20 000 points de données provenant des caméras Hawk-Eye. Sur un match de 48 minutes, cela représente des dizaines de millions de mesures de position. Quelque part dans ce flux se trouvent les réponses aux questions qui obsèdent les équipes : comment prévenir les blessures, mieux repérer les talents, analyser les actions, optimiser les alignements et même affiner les techniques de tir. La partie difficile est de construire les plateformes de données et les modèles d'IA qui répondent à ces questions de manière fiable et à grande échelle. Ces systèmes doivent être suffisamment rapides pour influencer ce qui se passe sur le terrain, dans le vestiaire et au bureau.

Dans le sport professionnel, le volume de données biomécaniques et de suivi n'a jamais été aussi élevé. Cependant, la capacité de la plupart des organisations à utiliser réellement ces données pour résoudre leurs cas d'utilisation clés n'a guère évolué. La plateforme Databricks Data Intelligence Platform aide les équipes de données sportives à combler ce fossé, offrant aux équipes la possibilité de créer de nouvelles capacités de Sports Intelligence pour leurs joueurs et entraîneurs, leur permettant enfin de valoriser cette quantité massive de données. Databricks aide les équipes à maintenir leurs joueurs en meilleure santé, à gagner plus de matchs, à améliorer les performances et à fonctionner plus efficacement dans l'ensemble de leur écosystème.

L'explosion des données

En mars 2023, la NBA a remplacé le suivi des joueurs par le centre de masse de Second Spectrum par le système SkeleTRACK de Sony Hawk-Eye dans les 29 arénas. Le nouveau flux capture 29 articulations squelettiques sur chaque joueur et arbitre, 13 personnes sur le terrain à tout moment, échantillonné 60 fois par seconde. Cela représente environ 22 620 mises à jour de position par seconde, de l'ordre de 65 millions d'enregistrements par match de 48 minutes, et environ 80 milliards d'enregistrements sur une saison régulière de 82 matchs, sans compter les playoffs ou les entraînements.

C'est un bond générationnel, les données SkeleTRACK étant environ deux ordres de grandeur plus riches et capturant pour la première fois la pose complète en 3D en temps réel. Ce que les données débloquent, ce ne sont pas la « détection d'objets » ou la « vision par ordinateur ». Ce sont les moyens. Les résultats réels sont ce qui intéresse les équipes :

  • Comprendre comment la mécanique d'un tireur évolue en fin de match lorsque la fatigue modifie l'angle du coude et la hauteur de libération.
  • Détecter des changements subtils dans les schémas de mouvement qui précèdent les blessures aux ligaments croisés antérieurs et au tendon d'Achille.
  • Quantifier comment les schémas défensifs, la proximité du défenseur et l'action spécifique en cours affectent la précision du tir.
  • Comparer la charge biomécanique entre les matchs pour optimiser les décisions de repos et réduire les blessures.
  • Personnaliser le développement des compétences en associant la mécanique unique de chaque athlète à ses résultats de réussite/échec au lieu d'imposer un modèle d'entraînement générique.
  • Concevoir des profils de mouvement spécifiques aux rôles et aux positions afin que les équipes puissent recruter, échanger et développer des joueurs dont la biomécanique correspond à leur système.

La couche de suivi se consolide également dans tous les sports. Hawk-Eye est déjà déployé dans la Premier League, les quatre tournois du Grand Chelem de tennis, le DRS de cricket, Statcast de la MLB, la NASCAR et la Formule 1. La LNH a élargi son partenariat de suivi des rondelles et des joueurs, l'extension biomécanique étant la prochaine étape évidente, et la NFL suit de près. Quelle que soit la base qu'une organisation sportive construit pour Hawk-Eye dans un sport, elle lui servira dans tous les sports qu'elle pratique.

Hawk-Eye fournit le flux aux équipes. Il ne leur donne pas les réponses. La question est : qu'en faites-vous ?

Le fossé d'intégration

Au sein d'une organisation sportive professionnelle moderne, la pile d'analyse est souvent répartie entre des composants de plusieurs fournisseurs. Les données de suivi proviennent d'un fournisseur, les dispositifs portables d'un autre, la vidéo ailleurs, le repérage des adversaires et les étiquettes d'événements d'un fournisseur différent, et l'analyse des blessures d'un autre encore. Combiné à l'échelle des données impliquées, cela peut entraîner plusieurs défis dans l'industrie.

  • Silos de « vérité ». L'équipe de performance, le personnel médical et l'équipe d'entraîneurs travaillent chacun avec leur propre version (souvent contradictoire) des mêmes données de joueur, la réconciliation prenant des semaines.
  • Latence qui s'accumule. Chaque étape entre les fournisseurs introduit un délai. Certaines questions nécessitent des réponses en temps réel sur le banc, d'autres doivent simplement être disponibles le matin à un coût raisonnable, mais la plupart des équipes ont du mal à satisfaire l'un ou l'autre de manière fiable.
  • Aucune gouvernance et aucune étiquette de confiance. Qui a accès à quoi ? Pouvez-vous retracer une prédiction jusqu'au dossier médical, au fichier du dispositif portable et à l'image de la caméra qui l'a générée ? Pouvez-vous faire confiance à une étiquette d'événement d'un fournisseur externe lorsque vous savez qu'elle est parfois erronée ? La plupart des équipes continuent d'utiliser ces étiquettes de toute façon, pleinement conscientes des problèmes mais contraintes par les outils dont elles disposent aujourd'hui.
  • Réconciliation d'arène. Les positions des caméras, la géométrie du terrain et la dérive de calibration diffèrent entre les lieux. Même la sortie brute de Hawk-Eye nécessite une normalisation avant d'être comparable d'un match à l'autre.
  • Calcul qui ne s'adapte pas. 953 000 images par match poussent les tables traditionnelles d'entrepôt de données au-delà des limites pratiques. Les équipes de science des données sportives se rabattent régulièrement sur Python local sur un ordinateur portable, téléchargeant des échantillons et espérant que l'échantillon est représentatif.

Ce ne sont pas des problèmes qu'une autre solution ponctuelle résoudra. Le coût de la fragmentation se traduit par des signaux de blessure manqués, des décisions plus lentes pendant le jeu et une incapacité à effectuer une véritable analyse inter-domaines combinant les données de suivi avec l'historique médical, la charge de travail et les tendances des adversaires. La pièce manquante n'est pas un autre outil. Ce dont les équipes ont besoin, c'est d'une plateforme de données et d'IA gouvernée où tous ces outils et flux de données peuvent converger.

Sports Intelligence sur le Lakehouse

La plateforme Databricks Data Intelligence Platform est le centre composable où les systèmes de suivi, de dispositifs portables, vidéo, de repérage, médicaux, opérationnels et d'engagement des fans d'une organisation convergent en un seul domaine gouverné. Elle fournit aux équipes la base nécessaire pour transformer les sorties de ces systèmes en quelque chose d'utilisable par un entraîneur pendant un temps mort, un biomécanicien dans un laboratoire et un directeur général à la date limite des échanges.

Sports Intelligence on the Lakehouse

Aperçu général :

Ingérer. Lakeflow gère l'ingestion en flux continu des flux Hawk-Eye, des dispositifs portables et des événements à la vitesse du jeu. Auto Loader et les pipelines déclaratifs permettent aux équipes de mettre en place une ingestion de production sans écrire manuellement de Spark personnalisé. C'est important dans une industrie où l'organisation analytique n'est souvent qu'une poignée de personnes.

Organiser. Une architecture médaillon affine progressivement les données brutes en informations utilisables. Bronze capture les images continues de 60 Hz. Silver est le catalogue d'événements : possessions, tirs, écrans, confrontations défensives, avec des plages d'images corrélées à la sortie de la caméra et la calibration de l'arène appliquée. Gold est la couche de fonctionnalités prêtes pour l'analyse qui alimente les modèles et les tableaux de bord.

Gouverner. Unity Catalog fournit la lignée, le contrôle d'accès et l'auditabilité sur l'ensemble du domaine données + IA. C'est important lorsque les données médicales côtoient les données de performance. La qualité et la confiance des données sont également importantes. La lignée et la surveillance de la qualité permettent à une équipe de prouver quelles étiquettes d'événements elle approuve, quelle calibration d'arène a dérivé et quel modèle en aval a été entraîné sur quel flux. Ce type de provenance est le prérequis pour fonder de réelles décisions sur les données, et la plupart des équipes ne l'ont pas aujourd'hui.

Analyser. Les modèles de ML comme la probabilité de tir, le risque de blessure et l'indice de fatigue s'entraînent au sein de la même plateforme. Model Serving les déploie. AI Search rend le catalogue vidéo interrogeable par similarité, afin qu'un entraîneur puisse trouver tous les 3 points contestés dans le quatrième quart-temps contre une défense qui change sans avoir à parcourir manuellement les bandes. Via une interface unique, une équipe peut également accéder à n'importe quel modèle de fondation externe pour des tâches de vision-langage comme la détection de blessures à partir d'images de diffusion ou remplacer ses propres modèles personnalisés ou open source, un flux de travail déjà utilisé par les leaders de l'analyse dans le sport professionnel.

Servir. Lakebase apporte une latence de requête inférieure à la seconde à la couche interactive, afin que les applications destinées aux analystes et les tableaux de bord en bord de terrain n'attendent pas un entrepôt. Databricks Apps héberge les applications analytiques personnalisées nécessaires aux équipes sportives sophistiquées : la visionneuse biomécanique 3D, l'application iPad sur le banc, l'outil d'évaluation du bureau des opérations. Elles s'exécutent sur la même plateforme gouvernée qui produit les données, sans pile d'hébergement séparée.

game feed

Démocratiser. Databricks Genie permet aux entraîneurs, aux préparateurs physiques et au personnel de direction de poser des questions en langage naturel (« Comment les mécaniques de tir de mes cinq titulaires ont-elles changé contre la défense de zone au cours des dix derniers matchs ? ») et d'obtenir une réponse « en temps réel ». Des agents IA gèrent les flux de travail en plusieurs étapes derrière ces questions, exécutant les jointures et les agrégations qui nécessitaient auparavant un analyste à la demande.

L'objectif est la composabilité, pas le remplacement. Une équipe qui possède déjà Hawk-Eye conserve Hawk-Eye. Une équipe qui possède déjà Catapult conserve Catapult. Le lakehouse rend les sorties de ces investissements interopérables, gouvernées et suffisamment rapides pour être utilisées.

Ce qui devient possible

Trois résultats méritent réflexion. Il y en a d'autres, mais ce sont ceux que nous entendons le plus souvent.

1. Prévention des blessures et gestion de la charge

La disponibilité des joueurs est une priorité absolue dans toutes les ligues sportives majeures, les blessures de joueurs de haut profil faisant autant la une que les performances dominantes. Aujourd'hui, la plupart des équipes réagissent. Une star se blesse lors d'une action, le personnel médical diagnostique, le joueur manque du temps de jeu. Les données pour prédire (asymétries biomécaniques, deltas de charge d'atterrissage, charge cumulative) existent dans le flux. La plateforme pour les combiner entre les fournisseurs n'existe pas, dans la plupart des organisations.

Avec les données squelettiques de Hawk-Eye unifiées avec la charge de travail, l'historique médical et le contexte jeu par jeu dans une plateforme gouvernée unique, les équipes peuvent voir des signes avant-coureurs qu'aucun système unique ne détecte seul. Anomalies du schéma de mouvement dans les jours précédant une déchirure du LCA. Asymétries bilatérales qui suivent le risque d'Achille. Une charge cumulative de haute intensité qui dépasse le seuil spécifique au joueur dont se soucie le personnel médical. Le passage de la réaction à l'anticipation, et c'est la conversation que le personnel d'entraînement peut avoir avec un entraîneur principal et un directeur général en toute confiance.

2. Intelligence d'entraînement en temps réel

Pendant un temps mort, un assistant consulte un iPad avec l'analyse du match en cours. Quelles compositions produisent des tirs efficaces contre la couverture de changement de l'adversaire ? Comment la proximité du défenseur affecte-t-elle le point de libération de nos shooteurs ? Quels jeux que nous exécutons ce soir sont mécaniquement bien réalisés, et lesquels se dégradent au quatrième quart-temps ? Dans quelle mesure un défenseur spécifique perturbe-t-il la mécanique de notre attaque, au-delà de ce que montre le tableau de bord ?

Cette capacité repose sur un service en sous-seconde et des applications personnalisées, et elle nécessite des données suffisamment gouvernées et propres pour que les entraîneurs et les préparateurs physiques puissent faire confiance à ce qu'ils voient. La plupart des entraîneurs et des préparateurs physiques n'écrivent pas de SQL. Genie rend l'interface en langage naturel. Les applications rendent l'expérience ciblée. Unity Catalog rend les réponses traçables. L'information alimentée par l'IA devient disponible pour chaque membre du personnel qui en a besoin, tout en donnant à l'équipe d'analyse les outils pour s'assurer en toute confiance que ces réponses sont fiables et disponibles de manière constante.

Intelligence d'entraînement en temps réel

3. Expériences améliorées pour les fans et la diffusion

Le match NBA du jour de Noël 2024 a été la première diffusion entièrement animée de la ligue, basée sur les données SkeleTRACK. C'était la preuve de concept. La plateforme rend le modèle de production réel. Les diffuseurs peuvent afficher des superpositions biomécaniques en temps réel pendant les matchs en direct. Les partenaires de fantasy et de paris peuvent consommer des flux gouvernés et enrichis via Delta Sharing. De nouveaux formats (rediffusions 3D avec contexte biomécanique, packages de faits saillants générés par IA, expériences interactives sur écran secondaire) deviennent une question de conception plutôt que d'infrastructure.

Le lakehouse qui exécute le modèle de risque de blessure est le même lakehouse qui produit le flux de diffusion. C'est le rôle de la plateforme, et une organisation sportive devrait s'attendre à ce que la sienne fasse les deux à partir d'un seul environnement.

Basketball et au-delà

Le schéma se généralise à tous les sports riches en suivi. Hawk-Eye dans le football alimente la VAR, le hors-jeu semi-automatisé et l'analyse tactique. La biomécanique du lancer de KinaTrax dans la MLB entraîne la prévention des blessures du LCA, un problème d'un milliard de dollars à lui seul. La mécanique du service au tennis, les actions de lancer au cricket et la prochaine vague de suivi squelettique arrivant dans la NFL partagent tous la même forme : données spatiales à haute fréquence, plus vidéo, plus médical, plus contexte, unifiés, gouvernés et servis rapidement.

Les mêmes schémas s'étendent entièrement en dehors des sports. Capture de mouvement dans les soins de santé, robotique de fabrication, perception des véhicules autonomes. Partout où une équipe dispose de données multimodales à haute fréquence, le lakehouse fournit la même solution robuste et composable.

Et ensuite ?

Pour les leaders en science des données, en analyse et en performance, le suivi squelettique n'est plus une hypothétique ; il est déjà là ou en route. La seule question est de savoir si votre plateforme est prête.

En savoir plus sur Databricks pour les médias et le divertissement, ou demander une démo pour voir comment votre organisation peut générer des informations concurrentielles.

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Recevez les derniers articles dans votre boîte mail

Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.