주요 컨텐츠로 이동
Comcast

고객
사례

음성, 데이터 및 AI로 홈 엔터테인먼트 혁신

10배

전체적인 데이터 처리 컴퓨팅 비용 절감

90%

인프라 관리에 필요한 DevOps 리소스 감소

동영상 보기

수백만의 고객을 개인화된 경험에 연결해주는 글로벌 기술 미디어 기업인 Comcast는 방대한 데이터, 취약한 데이터 파이프라인, 데이터 사이언스 협업 부족으로 인해 어려움을 겪었습니다. Delta Lake 및 MLflow를 활용하는 Databricks를 사용한 덕분에 페타바이트 규모 데이터를 처리하는 성능을 갖춘 데이터 파이프라인을 구축하고 수백 개 모델의 수명 주기를 관리하여, 음성 인식과 머신 러닝을 적용한 매우 혁신적이고 독창적이면서도 수상 경력에 빛나는 시청 환경을 구현할 수 있었습니다.

데이터 및 ML 요구 사항에 못 미치는 인프라

특정 프로그램에서 고객의 음성 요청에 즉시 답하면서도 수십억 개의 개별 상호작용을 실천 가능한 인사이트로 바꾸는 작업은 Comcast IT 인프라와 데이터 분석, 데이터 사이언스 팀에 부담을 주었습니다. 설상가상으로 클라우드, 온프레미스 등에 흩어진 서로 다른 범위의 환경에, 또 경우에 따라서는 기기에 직접 모델을 배포해야 했습니다.

  • 방대한 데이터: 엔터테인먼트 시스템에서 생성되는 수십억 건의 이벤트와 2,000만 건 이상의 음성 명령이 쌓임에 따라 세션화해서 분석해야 할 데이터가 페타바이트 규모를 넘어섰습니다.

  • 취약한 파이프라인: 복잡한 데이터 파이프라인은 수시로 장애가 일어났고 복구가 어려웠습니다. 작은 파일들을 관리하기 어려워 다운스트림 머신 러닝에 데이터를 입력하는 속도가 느려졌습니다.

  • 협업 부족: 서로 다른 지역에서 서로 다른 스크립팅 언어로 작업하는 데이터 사이언티스트들은 코드를 공유하고 재사용하기가 어려웠습니다.

  • ML 모델 관리: 수백 개의 모델을 개발, 훈련 및 배포하는 작업은 대체로 수동으로 이루어져서 느린 데다 복제가 힘들어 확장이 어려웠습니다.

  • 개발과 배포 간의 마찰: 개발팀에서는 최신 도구와 모델을 사용하고 싶어 하지만, 운영팀에서는 검증된 인프라에 배포하고 싶어 했습니다.

Delta Lake를 사용한 인프라 자동화, 데이터 파이프라인 가속화

Comcast는 데이터 수집에서 머신 러닝 모델 배포에 이르기까지 모든 분석 방식을 현대화하여 고객이 만족할 만한 새로운 기능을 제공해야 할 필요성을 느꼈습니다. 지금은 Databricks 레이크하우스 플랫폼을 사용하여 풍부한 데이터 세트를 구축하고 대규모로 머신 러닝을 최적화하고 있으며, 팀 간 워크플로 간소화, 협업 강화, 인프라 복잡성 완화, 우수한 고객 환경 지원이 가능해졌습니다.

  • 간소화된 인프라 관리: 자동 클러스터 관리 및 비용 관리 기능(예: 자동 확장, 스팟 인스턴스)으로 운영 비용을 절감했습니다.

  • Delta Lake를 사용한 적절한 성능의 데이터 파이프라인: Delta Lake는 영상 및 음성 애플리케이션과 기기에서 수집한 원본 원격 측정 정보를 수집, 보강하여 최초 처리하는 데 사용합니다.

  • 작은 파일들을 신속히 관리: Delta Lake는 대규모로 빠르고 안정적으로 데이터를 입력할 수 있도록 파일을 최적화합니다.

  • 협업 워크스페이스: Comcast는 인터랙티브 노트북으로 팀 간 협업과 데이터 사이언스 창의성 발휘 환경을 개선하고, 모델 프로토타이핑 속도를 크게 단축해 이터레이션을 가속화합니다.

  • 단순화된 ML 수명 주기: 관리형 MLflow의 Kubeflow 환경을 통해 머신 러닝 수명 주기와 모델 제공을 단순화하여 수백 개의 모델을 간편하게 추적, 관리합니다.

  • 안정적인 대규모 ETL: Delta Lake는 대규모로 효율적인 분석 파이프라인에서 과거 데이터와 스트리밍 데이터를 안정적으로 결합하여 더욱 풍부한 인사이트를 제공합니다.

  • 또한 Comcast는 Tableau를 사용하여 애널리스트에게 데이터를 제공함으로써 고객 분석용 데이터 세트를 빠른 속도로 더 폭넓게 지원합니다.

Video - Comcast makes home entertainment accessible to everyone with voice, data and AI

Behind the story: The Data Team Effect

Meet the great data team that’s behind Comcast

Delivering personalized experiences with ML

In the intensely competitive entertainment industry, there is no time to press the pause button. Armed with a unified approach to analytics, Comcast can now fast forward into the future of AI-powered entertainment – keeping viewers engaged and delighted with competition-beating customer experiences.

  • Emmy winning viewer experience: Databricks helps enable Comcast to create a highly innovative and award winning viewer experience with intelligent voice commands that boosts engagement

  • Reduced compute costs by 10X: Delta Lake has enabled Comcast to optimize data ingestion, replacing 640 machines with 64 while improving performance. Teams can spend more time on analytics and less time on infrastructure management.

  • Less devops: Reduced number of devops full-time employees required for onboarding 200 users from 5 to 0.5.

  • Higher data science productivity: Fostered collaboration between global data scientists by enabling different programming languages through a single interactive workspace. Also, Delta Lake has enabled the data team to use data at any point within the data pipeline, allowing them to act more quickly in building and training new models.

  • Faster model deployment: reduced deployment times from weeks to minutes as operations teams deployed models on disparate platforms