고객 사례

AI를 통한 패션 혁명

70%

운영 비용 절감

배경 이미지

업종: 리테일 및 소비재

업종별 사용 사례: 수요 예측, 안전 재고 분석

플랫폼 사용 사례: Delta Lake, 데이터 사이언스, 머신 러닝, ETL

클라우드: Azure

"Databricks는 우리 데이터 비즈니스의 핵심이자, 인사이트를 얻는 곳입니다.”

— Errol Koolmeister, H&M, AI 기술 및 아키텍처 부문 책임자

패션 및 리테일 산업의 선두적인 파괴자이자 혁신자인 H&M은 모든 운영의 중심에 데이터가 있습니다. 전 세계 곳곳에서 빠른 속도로 신규 매장을 내면서, 이에 따른 비용을 줄이고 매출을 극대화하기 위해 공급망과 운영 예측을 개선해야 했습니다. 하지만 레거시 온프레미스 하둡 시스템은 수백만 고객에 의해 생성된 데이터를 수집, 분석하여 예측적 모델을 운영하기에는 역부족이었습니다. H&M은 확장성이 한계에 달한 것을 깨닫고 Databricks 플랫폼으로 인프라를 옮겨 관리를 단순화하고, 대규모로 적절한 성능의 데이터 파이프라인을 지원하였으며, 머신 러닝 수명 주기도 줄였습니다. 그 덕분에 데이터 기반 의사 결정으로 비즈니스 성장을 가속화할 수 있었습니다.

기업의 성장을 지원하지 못하는 레거시 아키텍처

H&M은 공급망 효율성을 높이기 위해 데이터와 AI를 활용하여 의사 결정과 운영을 개선하기로 했습니다. 하지만 기존의 하둡 기반 아키텍처는 비효율적이었고 빠르게 변화하는 비즈니스 요구 사항에 맞추어 확장할 수 없었습니다.

  • 70개 이상의 시장에 진출한 5,000개 이상의 매장에는 매일 수많은 고객이 방문하고 방대한 데이터가 생성됩니다.
  • 고정된 클러스터 크기, 리소스 소모가 크고 확장 비용이 많이 드는 복잡한 인프라 및 데이터 보안 등의 문제로 데이터 엔지니어링이 난항을 겪었습니다.
  • 사일로화된 온갖 데이터 소스에서 데이터가 수집되는 데 비해, 데이터 사이언스 활동을 지원할 수 있을 만큼 운영을 확장하기는 어려웠습니다.
  • DevOps가 상당히 지연되어 시장 출시 시간이 길어졌고, 데이터 사이언티스트가 빠르게 모델을 구축하여 훈련, 배포하는 능력도 저하되었습니다. 아이디어 구상에서 프로덕션 배포까지 1년이 걸렸습니다.

데이터 운영 간소화로 ML 혁신 가속화

Databricks의 플랫폼을 사용하는 H&M은 데이터 사이언스와 엔지니어링에서 확장 가능한 협업 환경을 강화하였고, 그 결과 데이터 엔지니어와 데이터 사이언티스트는 클러스터를 관리하는 대신 전체 데이터 수명 주기에 집중해 공급망에 대한 신속한 의사 결정 지원을 목표로 빠르게 모델을 훈련하고 운영에 적용했습니다.

  • 자동 클러스터 관리 기능을 탑재한 완전 관리형 플랫폼은 대규모 인프라 관리와 운영을 단순화합니다.
  • 다양한 언어(SQL, Scala, Python, R)를 지원하는 협업 노트북 환경은 여러 사용자 팀이 원하는 언어로 협력할 수 있도록 지원함으로써, 팀 간에 통합된 환경을 조성하여 생산성을 향상합니다.
  • Databricks 플랫폼을 Azure 및 Apache Airflow, Kubernetes 등의 다른 기술과 통합하면 대규모의 탄력적 모델 훈련이 가능합니다.

현명한 의사 결정, 크나큰 비용 절감 효과

H&M에서는 모델 하나의 정확도를 0.1%만 개선해도 비즈니스에 엄청난 영향이 미칩니다. Databricks를 사용한 후, 모든 의사 결정권자가 데이터에 더 쉽게 접근할 수 있게 되었고 비즈니스가 시류에 편승하고 성장하는 속도가 빨라졌습니다.

  • 운영 효율성 개선: 클러스터 자동 확장과 같은 기능으로 데이터 수집부터 모든 머신 러닝 수명 주기 관리에 이르기까지 운영 전반을 개선해 운영 비용을 70% 절감했습니다.
  • 팀 간 협업 개선: 데이터 사이언티스트와 엔지니어의 통합 분석 환경은 설정과 관리가 쉬워, 프로덕션 배포에 필요한 구성 요소의 수가 극적으로 줄어들었습니다.
  • 인사이트를 빠르게 확보하여 엄청난 비즈니스 효과 달성: 더욱 세분화된 의사 결정으로 전략적 의사 결정과 비즈니스 예측을 개선했습니다.