주요 컨텐츠로 이동
산업

스포츠 인텔리전스의 부상: 레이크하우스가 추적 데이터를 경쟁 우위로 전환하는 방법

선수 추적, 생체 역학 및 운영을 코트 내 및 프런트 오피스 의사 결정과 연결하는 현대적인 데이터 및 AI 기반

작성자: 코리 앱셔, Kush Patel , 닉 라고네세

  • 프로 팀이 급증하는 추적 및 생체 역학 데이터(NBA Hawk‑Eye SkeleTRACK 등)를 코트, 훈련실, 프런트 오피스에서 의사 결정을 실제로 변화시키는 스포츠 인텔리전스로 전환하는 방법을 보여줍니다.
  • Databricks Data Intelligence Platform을 거버넌스되는 "스포츠 두뇌"로 활용하여 추적, 의료, 웨어러블, 비디오, 스카우팅 및 팬 데이터를 하나의 레이크하우스에 통합하고, Lakeflow, Unity Catalog, ML, AI Search 및 초고속 애플리케이션을 적용하여 실시간 워크플로우를 지원합니다.
  • 사전 예방적 부상 및 워크로드 관리, 매치업 및 메커니즘에 대한 실시간 코칭 인사이트, 생체 역학 오버레이 및 인터랙티브 데이터 기반 리플레이와 같은 차세대 팬 및 방송 경험 등 구체적인 성과를 강조합니다.

프로 농구 경기 매 초마다 Hawk-Eye 카메라에서 20,000개 이상의 데이터 포인트가 생성됩니다. 48분 경기 동안 수천만 개의 위치 측정값이 축적됩니다. 그 데이터 스트림 어딘가에는 팀이 몰두하는 질문들, 즉 부상 방지, 더 정확한 스카우트, 플레이 분석, 라인업 최적화, 심지어 슈팅 메커니즘 미세 조정에 대한 답이 있습니다. 어려운 점은 이러한 질문에 대규모로 안정적으로 답할 수 있는 데이터 플랫폼과 AI 모델을 구축하는 것입니다. 이러한 시스템은 코트, 라커룸, 사무실에서 일어나는 일을 변화시킬 만큼 충분히 빨라야 합니다.

프로 스포츠 전반에 걸쳐 생체 역학 및 추적 데이터의 양은 그 어느 때보다 많습니다. 하지만 대부분의 조직이 이 데이터를 실제로 활용하여 주요 사용 사례를 해결하는 능력은 거의 발전하지 못했습니다. Databricks Data Intelligence Platform은 스포츠 데이터 팀이 이 격차를 해소하도록 돕고, 팀이 선수와 코치를 위한 새로운 스포츠 인텔리전스 기능을 만들어 방대한 데이터의 가치를 마침내 활용할 수 있는 기회를 제공합니다. Databricks는 팀이 선수를 더 건강하게 유지하고, 더 많은 경기를 이기며, 성능을 향상하고, 전체 생태계에서 더 효율적으로 운영되도록 돕습니다.

데이터 폭증

2023년 3월, NBA는 29개 모든 경기장에서 Second Spectrum의 질량 중심 선수 추적 시스템을 Sony Hawk-Eye의 SkeleTRACK 시스템으로 교체했습니다. 새로운 피드는 매 순간 코트 위의 선수와 심판 13명의 29개 골격 관절을 초당 60회 샘플링하여 캡처합니다. 이는 초당 약 22,620개의 위치 업데이트, 48분 경기당 약 6,500만 개의 기록, 그리고 플레이오프나 연습을 제외한 82경기 정규 시즌 동안 약 800억 개의 기록에 해당합니다.

이는 SkeleTRACK 데이터가 약 두 자릿수 더 풍부하고 실시간으로 완전한 3D 자세를 처음으로 캡처한다는 점에서 세대적인 도약입니다. 이 데이터가 밝혀내는 것은 "객체 감지"나 "컴퓨터 비전"이 아닙니다. 그것들은 수단일 뿐입니다. 실제 결과는 팀이 중요하게 생각하는 것들입니다.

  • 피로가 팔꿈치 각도와 릴리스 높이를 변화시킬 때 경기 후반 슈터의 메커니즘이 어떻게 변하는지 이해합니다.
  • ACL 및 아킬레스건 부상에 앞서 나타나는 미묘한 움직임 패턴 변화를 감지합니다.
  • 수비 전술, 수비수 근접성, 실행되는 특정 플레이가 슛 정확도에 어떻게 영향을 미치는지 정량화합니다.
  • 경기 전반의 생체 역학적 부하를 비교하여 휴식 결정을 최적화하고 부상을 줄입니다.
  • 일반적인 훈련 모델을 강요하는 대신 각 선수의 고유한 메커니즘을 성공/실패 결과에 매핑하여 기술 개발을 개인화합니다.
  • 역할 및 포지션별 움직임 프로필을 설계하여 팀이 시스템에 맞는 생체 역학을 가진 선수를 드래프트하고, 트레이드하고, 개발할 수 있도록 합니다.

추적 레이어는 또한 스포츠 전반에 걸쳐 통합되고 있습니다. Hawk-Eye는 이미 프리미어리그, 4대 테니스 그랜드 슬램, 크리켓 DRS, MLB 스탯캐스트, NASCAR, 포뮬러 1에 배포되어 있습니다. NHL은 퍽 및 선수 추적 파트너십을 확장했으며, 생체 역학적 확장이 다음 단계로 분명하며, NFL도 긴밀하게 뒤따르고 있습니다. 스포츠 조직이 한 스포츠에서 Hawk-Eye를 위해 구축하는 기반은 해당 조직이 참여하는 모든 스포츠에서 활용될 것입니다.

Hawk-Eye는 팀에게 피드를 제공합니다. 하지만 팀에게 답을 주지는 않습니다. 질문은 '그것으로 무엇을 할 것인가?'입니다.

통합 격차

현대 프로 스포츠 조직 내에서 분석 스택은 종종 여러 공급업체의 구성 요소에 분산되어 있습니다. 추적 데이터는 한 공급업체에, 웨어러블은 다른 공급업체에, 비디오는 또 다른 곳에, 상대 스카우트 및 이벤트 라벨은 다른 공급업체에, 부상 분석은 또 다른 공급업체에 있습니다. 관련된 데이터의 규모와 결합될 때, 이는 업계 전반에 걸쳐 여러 가지 문제로 이어질 수 있습니다.

  • "진실"의 사일로. 경기력 팀, 의료진, 코칭 스태프는 각각 동일한 선수 데이터에 대해 자신들만의 (종종 상충되는) "버전"으로 작업하며, 조정하는 데 몇 주가 걸립니다.
  • 누적되는 지연. 공급업체 간의 각 단계는 지연을 유발합니다. 일부 질문은 벤치에서 실시간 답변이 필요하고, 다른 질문은 합리적인 비용으로 아침까지 준비되어야 하지만, 대부분의 팀은 둘 중 어느 것도 안정적으로 달성하기 어렵습니다.
  • 거버넌스 부재 및 신뢰할 수 없는 라벨. 누가 무엇에 접근할 수 있습니까? 예측을 의료 기록, 웨어러블 파일, 그리고 그것을 생성한 카메라 프레임으로 추적할 수 있습니까? 외부 공급업체의 이벤트 라벨이 때때로 잘못되었다는 것을 알면서도 신뢰할 수 있습니까? 대부분의 팀은 문제점을 충분히 인지하고 있지만 현재 가지고 있는 도구에 제약되어 어쨌든 해당 라벨을 계속 사용합니다.
  • 경기장 조정. 카메라 위치, 코트 기하학, 보정 편차는 경기장마다 다릅니다. 심지어 원본 Hawk-Eye 출력도 경기별 비교가 가능하도록 정규화가 필요합니다.
  • 확장되지 않는 컴퓨팅. 경기당 953,000프레임은 기존 데이터 웨어하우스 테이블을 실용성의 한계 이상으로 밀어붙입니다. 스포츠 데이터 과학 팀은 일반적으로 노트북에서 로컬 Python으로 돌아가 샘플을 다운로드하고 샘플이 대표적이라고 기대합니다.

이것들은 또 다른 포인트 솔루션이 해결할 수 있는 문제가 아닙니다. 파편화의 비용은 놓친 부상 신호, 느린 경기 중 의사 결정, 그리고 추적 데이터를 의료 기록, 작업 부하, 상대방 성향과 결합하는 진정한 교차 도메인 분석을 실행할 수 없는 형태로 나타납니다. 부족한 것은 또 다른 도구가 아닙니다. 팀에 필요한 것은 모든 도구와 데이터 스트림이 통합될 수 있는 거버넌스 데이터 및 AI 플랫폼입니다.

레이크하우스 기반 스포츠 인텔리전스

Databricks Data Intelligence Platform은 조직의 추적, 웨어러블, 비디오, 스카우트, 의료, 운영 및 팬 참여 시스템이 단일 거버넌스 환경으로 통합되는 구성 가능한 중심입니다. 이는 팀에게 해당 시스템의 결과물을 타임아웃 중인 코치, 실험실의 생체 역학자, 트레이드 마감일의 단장이 활용할 수 있는 것으로 전환할 수 있는 기반을 제공합니다.

Sports Intelligence on the Lakehouse

개요:

수집. Lakeflow는 경기 속도로 Hawk-Eye, 웨어러블 및 이벤트 피드의 스트리밍 수집을 처리합니다. Auto Loader와 선언적 파이프라인은 팀이 수동으로 사용자 지정 Spark 코드를 작성하지 않고도 프로덕션 수집을 설정할 수 있도록 합니다. 이는 분석 조직이 소수의 인원으로 구성되는 업계에서 중요합니다.

구성. 메달리온 아키텍처는 원시 데이터를 점진적으로 유용한 인사이트로 정제합니다. 브론즈 계층은 연속적인 60Hz 프레임을 캡처합니다. 실버 계층은 이벤트 카탈로그로, 소유권, 슛, 스크린, 수비 매치업 등을 카메라 출력과 경기장 보정에 맞춰 프레임 범위와 함께 제공합니다. 골드 계층은 모델과 대시보드를 구동하는 분석 준비가 된 기능 계층입니다.

거버넌스. Unity Catalog는 전체 데이터 + AI 환경에 걸쳐 계보, 접근 제어 및 감사 기능을 제공합니다. 이는 의료 데이터가 경기력 데이터와 함께 있을 때 중요합니다. 데이터 품질과 신뢰 또한 중요합니다. 계보 및 품질 모니터링을 통해 팀은 어떤 이벤트 라벨을 신뢰하는지, 어떤 경기장의 보정이 틀어졌는지, 어떤 다운스트림 모델이 어떤 피드로 훈련되었는지 증명할 수 있습니다. 이러한 출처 정보는 데이터에 기반한 실제 결정을 내리기 위한 전제 조건이며, 오늘날 대부분의 팀은 이를 갖추고 있지 않습니다.

분석. 슛 성공률, 부상 위험, 피로 지수와 같은 ML 모델은 동일한 플랫폼 내에서 훈련됩니다. Model Serving이 이를 배포합니다. AI Search는 비디오 카탈로그를 유사성으로 쿼리할 수 있게 하여, 코치가 수동으로 테이프를 돌려보지 않고도 스위치 수비를 상대로 한 4쿼터의 모든 컨테스트 3점 슛을 찾을 수 있습니다. 단일 인터페이스를 통해 팀은 방송 영상에서 부상 감지와 같은 비전-언어 작업을 위한 외부 파운데이션 모델에 접근하거나 자체 맞춤형 또는 오픈 소스 모델로 교체할 수 있으며, 이는 이미 프로 스포츠 분석 리더들이 사용하고 있는 워크플로입니다.

제공. Lakebase는 대화형 계층에 1초 미만의 쿼리 지연 시간을 제공하여, 분석가용 애플리케이션과 코트 사이드 대시보드가 웨어하우스를 기다리지 않도록 합니다. Databricks Apps는 정교한 스포츠 팀에 필요한 맞춤형 분석 애플리케이션(3D 생체 역학 뷰어, 벤치 사이드 iPad 앱, 프론트 오피스 평가 도구)을 호스팅합니다. 이들은 데이터를 생성하는 동일한 거버넌스 플랫폼에서 실행되며, 별도의 호스팅 스택이 필요 없습니다.

hawkeye

민주화하세요. Databricks Genie를 통해 코치, 트레이너, 프런트 오피스 직원은 자연어로 질문할 수 있습니다("지난 10경기 동안 우리 선발 5명의 3쿼터 슛 메커니즘이 지역 방어에 대해 어떻게 바뀌었습니까?") 그리고 “즉각적인” 답변을 얻을 수 있습니다. AI 에이전트는 이러한 질문 뒤에 있는 다단계 워크플로우를 처리하여, 과거에는 분석가가 상주해야 했던 조인 및 롤업을 실행합니다.

핵심은 교체가 아닌 구성 가능성입니다. 이미 Hawk-Eye를 사용하는 팀은 Hawk-Eye를 계속 사용합니다. 이미 Catapult를 사용하는 팀은 Catapult를 계속 사용합니다. 레이크하우스는 이러한 투자의 결과물을 상호 운용 가능하고, 거버넌스되며, 충분히 빠르게 사용할 수 있도록 만듭니다.

무엇이 가능해지는가

고려해 볼 만한 세 가지 결과입니다. 더 많은 것이 있지만, 이 세 가지가 가장 자주 언급됩니다.

1. 부상 예방 및 부하 관리

모든 주요 스포츠 리그에서 선수 가용성은 최우선 과제이며, 유명 선수의 부상은 뛰어난 경기력만큼이나 헤드라인을 장식합니다. 오늘날 대부분의 팀은 반응적입니다. 스타 선수가 경기 중 부상을 입으면 의료진이 진단하고, 선수는 경기에 결장합니다. 예측에 필요한 데이터(생체역학적 비대칭성, 착지 부하 변화, 누적 작업량)는 피드에 존재합니다. 하지만 대부분의 조직에서는 여러 공급업체의 데이터를 통합할 수 있는 플랫폼이 없습니다.

Hawk-Eye 골격 데이터가 작업량, 의료 기록, 경기별 맥락과 함께 하나의 거버넌스 플랫폼에 통합되면, 팀은 단일 시스템으로는 감지할 수 없는 경고 신호를 볼 수 있습니다. ACL 파열 전 며칠 동안의 움직임 패턴 이상. 아킬레스건 위험과 관련된 양측 비대칭성. 의료진이 중요하게 여기는 선수별 임계값을 초과하는 누적 고강도 부하. 이는 반응적 접근 방식에서 선제적 접근 방식으로의 전환이며, 훈련 스태프가 감독 및 단장에게 자신감을 가지고 제시할 수 있는 대화입니다.

2. 실시간 코칭 인텔리전스

타임아웃 동안, 어시스턴트 코치는 현재 매치업 분석이 담긴 iPad를 꺼냅니다. 상대의 스위치 수비에 대해 어떤 라인업이 효율적인 슛을 만들어내고 있는가? 수비수의 근접성이 우리 슈터의 릴리스 포인트에 어떻게 영향을 미치는가? 오늘 밤 우리가 실행하는 플레이 중 어떤 것이 기계적으로 깔끔하게 실행되고 있으며, 어떤 것이 4쿼터에 저하되고 있는가? 박스 스코어에 나타난 것 이상으로 특정 수비수 한 명이 우리 공격의 메커니즘을 얼마나 방해하고 있는가?

이 기능은 1초 미만의 서빙 및 맞춤형 앱 위에 구축되며, 코치와 트레이너가 보는 것을 신뢰할 수 있을 만큼 거버넌스되고 깨끗한 데이터를 필요로 합니다. 대부분의 코치와 트레이너는 SQL을 작성하지 않습니다. Genie는 인터페이스를 자연어로 만듭니다. 앱은 경험을 목적에 맞게 구축합니다. Unity Catalog는 답변을 추적 가능하게 만듭니다. AI 기반 인사이트는 필요한 모든 직원에게 제공되며, 동시에 분석 팀에게는 해당 답변이 신뢰할 수 있고 안정적으로 제공됨을 확신할 수 있는 도구를 제공합니다.

실시간 코칭 인텔리전스

3. 향상된 팬 및 방송 경험

NBA의 2024년 크리스마스 경기에서는 SkeleTRACK 데이터를 기반으로 한 리그 최초의 완전 애니메이션 방송이 이루어졌습니다. 그것이 개념 증명이었습니다. 이 플랫폼은 프로덕션 모델을 현실로 만듭니다. 방송사는 라이브 경기 중에 실시간 생체역학적 오버레이를 렌더링할 수 있습니다. 판타지 및 베팅 파트너는 Delta Sharing을 통해 거버넌스되고 풍부한 피드를 사용할 수 있습니다. 새로운 형식(생체역학적 맥락이 있는 3D 리플레이, AI 생성 하이라이트 패키지, 대화형 세컨드 스크린 경험)은 인프라 문제가 아닌 디자인 문제가 됩니다.

부상 위험 모델을 실행하는 레이크하우스는 방송 피드를 생성하는 레이크하우스와 동일합니다. 이것이 플랫폼의 역할이며, 스포츠 조직은 하나의 환경에서 이 두 가지를 모두 수행할 수 있을 것으로 기대해야 합니다.

농구, 그리고 그 너머

이 패턴은 트래킹 데이터가 풍부한 모든 스포츠에 적용됩니다. 축구의 Hawk-Eye는 VAR, 반자동 오프사이드, 전술 분석을 지원합니다. MLB의 KinaTrax 투구 생체역학은 UCL 부상 예방을 주도하며, 이는 자체적으로 수십억 달러 규모의 문제입니다. 테니스 서브 메커니즘, 크리켓 투구 동작, 그리고 NFL에 도입될 다음 단계의 골격 트래킹은 모두 고주파 공간 데이터, 비디오, 의료 데이터, 맥락이 통합되고 거버넌스되며 빠르게 제공된다는 동일한 형태를 공유합니다.

동일한 패턴은 스포츠 외의 분야에도 완전히 확장됩니다. 헬스케어 모션 캡처, 제조 로봇 공학, 자율 주행 차량 인식. 팀이 다중 모드 고주파 데이터를 보유한 모든 곳에서 레이크하우스는 동일하게 강력하고 구성 가능한 솔루션을 제공합니다.

다음은 무엇인가요?

데이터 과학, 분석 및 성과 분야의 리더들에게 골격 트래킹은 더 이상 가설이 아닙니다. 이미 현실이 되었거나 곧 현실이 될 것입니다. 유일한 질문은 귀사의 플랫폼이 이를 위한 준비가 되어 있는지 여부입니다.

미디어 및 엔터테인먼트를 위한 Databricks에 대해 자세히 알아보거나, 데모를 요청하여 귀사 조직이 어떻게 경쟁력 있는 인사이트를 얻을 수 있는지 확인하십시오.

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

최신 게시물을 이메일로 받아보세요

블로그를 구독하고 최신 게시물을 이메일로 받아보세요.