주요 컨텐츠로 이동

현대 리테일의 속도에 맞춘 예측

수요 계획 팀을 위한 MMF Agent를 소개합니다

작성자: 류타 요시마츠 , Puneet Jain, Lourdes Angélica Martinez Medina, Lucas Bruand , Dael Williamson

*엔터프라이즈 수요 예측은 레거시 도구로 처리하기에는 너무 복잡해졌습니다. 수백만 개의 시계열, SKU 급증, 촉박한 계획 주기는 이를 실행하는 데 필요한 기술과 인재 모두의 한계를 넘어섰습니다.
*MMF Agent는 Genie Code를 기반으로 구축된 가이드형 AI 워크플로로, 깊은 데이터 과학 전문 지식 없이도 Databricks의 다중 모델 예측 프레임워크를 쉽게 사용할 수 있도록 지원합니다.
*MMF Agent를 사용하는 팀은 며칠이 걸리던 설정 시간을 몇 시간으로 단축하고, 더 깨끗한 학습 데이터를 생성하며, 이전에는 전문 예측 인력을 보유한 조직만 누릴 수 있었던 다중 모델 정확도 향상을 실현합니다.

수요 예측은 항상 리테일 및 CPG 계획의 중심에 있었습니다. 이는 재고 의사결정을 형성하고, 생산 일정에 영향을 미치며, 판매 촉진 투자를 유도하고, 이후 이어지는 모든 S&OP 논의의 조건을 설정합니다. 예측이 틀리면 비용이 빠르게 누적되어 품절, 과잉 재고, 마진 감소, 그리고 공급망과 영업 팀 모두에 영향을 미치는 후속 혼란으로 이어집니다.

최근 몇 년 동안 변화한 것은 예측의 중요성이 아닙니다. 바로 난이도입니다.

복잡성 문제가 도구의 발전 속도를 앞질렀습니다

10년 전만 해도 몇 개의 채널에서 수천 개의 SKU를 다루는 수요 계획 담당자는 통계 모델, 스프레드시트, 그리고 어렵게 축적한 노하우를 결합하여 예측 품질을 관리할 수 있었습니다. 이제 대부분의 리테일 및 CPG 기업에 그러한 세상은 더 이상 존재하지 않습니다. SKU의 급증, 이커머스 채널의 폭발적인 성장, 지역적 세분화, 수명이 짧은 판촉용 SKU의 등장은 대부분의 레거시 도구로는 감당할 수 없는 예측 환경을 만들어냈습니다.

과거에는 계획 담당자가 수백 개의 시계열을 관리했다면, 오늘날의 기업 예측 문제는 일상적으로 수십만 개, 때로는 그보다 훨씬 더 많은 시계열을 포함합니다. 각 시계열은 고유한 계절성 프로필, 신호 대 잡음 특성, 그리고 프로모션, 날씨, 거시 경제 상황과 같은 외부 변수에 대한 고유한 민감도를 가집니다. 소규모에서 잘 작동했던 통계적 기법은 이처럼 방대한 양과 다양성 앞에서는 안정적으로 일반화되지 않습니다. 정확도는 떨어지고, 예외 관리는 감당할 수 없게 되며, 예측은 계획 수립을 위한 기준으로서의 신뢰성을 잃게 됩니다.

가장 정교한 예측 팀들이 도출한 해답은 다중 모델 접근 방식입니다. 단일 기법을 선택해 일률적으로 적용하는 대신, 실제 데이터를 바탕으로 다양한 모델을 평가하고 그 결과에 따라 각 시계열에 가장 적합한 모델을 결정하는 것입니다. 실제로 이 방식은 정확도를 눈에 띄게 향상시키지만, 동시에 새로운 과제를 안겨줍니다.

인재 부족 문제는 현실이며 해결하기가 점점 더 어려워지고 있습니다

기업 규모에서 엄격한 다중 모델 예측 평가를 실행하는 것은 비즈니스 분석가나 신입 데이터 사이언티스트에게 쉽게 맡길 수 있는 작업이 아닙니다. 통계적 예측 방법, 현대적인 머신러닝 및 딥러닝 접근 방식에 대한 깊은 이해가 필요하며, 최근 몇 년 동안 시계열 예측의 유망한 도구로 떠오른 트랜스포머 아키텍처 기반의 파운데이션 모델 제품군에 대해서도 잘 알아야 합니다. 또한 계획 주기 내에 수백만 개의 시계열을 처리하는 데 필요한 규모의 분산 컴퓨팅 인프라를 구성하고 운영할 수 있는 능력도 요구됩니다.

이러한 전문성을 갖춘 인재는 매우 드뭅니다. 수요 계획 부서는 데이터 사이언스 인재를 확보하기 위해 기업 내 다른 모든 부서와 경쟁해야 하며, 이 작업이 요구하는 예측 도메인 지식과 분산 시스템 숙련도의 특정 조합을 갖춘 인재는 정말 찾기 어렵습니다. 이를 갖춘 팀은 생산성이 높지만, 그렇지 못한 팀은 현대적인 대안에 비해 성능이 떨어지는 기존 방식에 갇히거나, 단 한 명의 전문가에게 의존하게 되어 그 전문가가 이탈할 경우 조직에 큰 리스크가 발생하게 됩니다.

인재를 보유한 조직이라 하더라도, 단 한 번의 모델 비교를 완료하기 위해 적절한 예측 실험을 설정하는 것(컴퓨팅 리소스 구성, 데이터 준비 및 정제, 평가 매개변수 선택, 백테스트 실행, 결과 해석)에 며칠에서 몇 주가 걸릴 수 있습니다. 계획 주기가 주 단위로 측정되는 환경에서 이러한 처리 시간은 너무 느린 경우가 많습니다.

Many Model Forecasting: 이 문제를 해결하기 위해 구축된 엔진

2024년에 Databricks는 대규모 다중 모델 시계열 예측을 위해 구축된 오픈 소스 프레임워크인 Many Model Forecasting (MMF)을 출시했습니다. MMF는 statsforecast 및 sktime의 통계적 접근 방식, neuralforecast의 딥러닝 모델, Chronos 및 TimesFM의 파운데이션 시계열 모델을 포함하여 주요 오픈 소스 라이브러리에서 가져온 35개 이상의 예측 모델을 통합합니다. MMF를 사용하면 단일 기법에만 의존하는 대신 모든 기법을 자체 데이터에 대해 동시에 평가할 수 있으며, 각 시계열에 대해 가장 성능이 좋은 모델이 자동으로 선택됩니다.

이 프레임워크는 Databricks에서 네이티브로 실행되며, 분산 컴퓨팅을 사용하여 기업의 리테일 및 CPG 예측 문제가 요구하는 대용량 데이터를 처리합니다. 현재 수십 개의 기업이 매출 및 재고 투자에 직접적인 영향을 미치는 계획 의사결정을 위해 MMF에서 프로덕션 파이프라인을 운영하고 있습니다. 이러한 배포 전반에서 정확도 향상과 수동 예측 작업의 감소가 일관되게 확인되었습니다.

하지만 MMF는 여전히 전문가를 위한 도구였습니다. 장벽은 프레임워크 자체가 아니었습니다. 프레임워크를 올바르게 설정하고, 컴퓨팅 구성, 데이터 준비 및 평가 설계에 대해 올바른 결정을 내리며, 결과를 실제 계획 의사결정에 반영할 수 있도록 해석하는 데 필요한 지식의 깊이가 장벽이었습니다. MMF는 전문가 수준의 예측을 더 빠르게 만들어 주었지만, 누구나 쉽게 접근할 수 있도록 만들지는 못했습니다.

MMF Agent: 기업의 다른 구성원들을 위한 가이드형 예측

MMF Agent는 이러한 격차를 해소합니다. Databricks의 AI 코딩 어시스턴트인 Genie Code를 기반으로 구축된 MMF Agent는 MMF 프레임워크를 대화형 가이드 워크플로우로 감싸, 팀이 깊은 기술적 전문성 없이도 원시 데이터부터 배포된 예측에 이르기까지 전체 예측 파이프라인을 진행할 수 있도록 지원합니다.

이 에이전트는 5단계로 작동합니다. 먼저 입력 데이터를 검사하여 품질 문제를 식별하고, 결측치 및 이상치를 처리하며, 모든 데이터가 예측 엔진에 맞게 올바르게 구성되었는지 확인하는 것으로 시작합니다. 그런 다음 데이터 세트의 시계열을 프로파일링하고 분류하여 예측 가능한 시계열과 신호가 불충분한 시계열을 분리합니다. 이 단계는 MMF를 수동으로 실행할 때 건너뛰기 쉽지만, 가장 큰 영향을 미칠 수 있는 곳에 리소스를 집중시킴으로써 정확도와 컴퓨팅 효율성을 모두 일관되게 향상시킵니다. 거기서부터 에이전트는 평가 중인 모델에 적합한 컴퓨팅 인프라를 구성하고, 예측 작업을 실행하며, 후처리 및 모델 선택을 수행하여 계획 팀이 실제로 중요하게 생각하는 비즈니스 성과와 연계된 용어로 결과를 제시합니다. 아래의 짧은 데모는 수요 계획 담당자가 Genie Code에서 MMF Agent를 사용하여 이러한 각 단계를 진행하는 모습을 보여줍니다.

단순한 워크플로우 자동화와 다른 점은 에이전트가 대화형이라는 것입니다. Genie Code와 Unity Catalog의 통합을 활용하여 조직의 전체 데이터 환경을 이해하므로, 어떤 데이터 세트를 사용할지, 관련 외부 변수로 학습 데이터를 어떻게 보강할지, 비즈니스 관점에서 예측 정확도 지표를 어떻게 해석할지에 대해 정보에 기반한 권장 사항을 제공할 수 있습니다. 데이터 사이언티스트는 아니지만 비즈니스를 잘 이해하고 있는 계획 책임자는 수요 계획 용어(프로모션, 계절성, 채널 믹스, 계획 기간)를 사용하여 MMF Agent와 소통하고, 예측 모범 사례와 데이터의 특성 모두에 기반한 가이드를 받을 수 있습니다.

수요 계획 팀에 이것이 의미하는 바

가장 즉각적인 이점은 속도입니다. 이전에는 숙련된 데이터 사이언스 인력이 며칠 동안 작업해야 했던 설정 및 실험 작업을 몇 시간 만에 완료할 수 있습니다. 이러한 시간 단축은 계획 환경에서 매우 중요합니다. 팀이 더 많은 실험을 실행하고, 더 많은 모델 구성을 테스트하며, 시장 상황이 변할 때 더 빠르게 대응할 수 있음을 의미하기 때문입니다. 이는 과거의 패턴을 더 이상 신뢰할 수 없을 때 매우 중요합니다.

예측 정확도 또한 향상되는 경향이 있습니다. MMF Agent가 안내하는 데이터 준비 및 시계열 분류 단계는 일반적으로 수동 접근 방식보다 더 깨끗한 학습 데이터를 생성하고 더 정밀한 모델 선택을 가능하게 합니다.

하지만 가장 중요한 변화는 아마도 접근성의 확대일 것입니다. 전담 예측 데이터 사이언티스트가 없는 수요 계획 팀도 이제 이전에는 불가능했던 수준의 방법론적 엄격함을 갖추고 운영할 수 있습니다. 다중 모델 예측을 전문 인재를 보유한 조직에만 국한시켰던 전문성 장벽이 낮아지면서, 훨씬 더 다양한 중견 리테일 및 CPG 기업들이 이 접근 방식을 활용할 수 있게 되었습니다.

기술적 역량이 뛰어난 팀의 경우, MMF Agent를 통해 프레임워크를 더 쉽게 맞춤화할 수 있습니다. MMF는 항상 오픈 소스였지만, 실제로 이를 수정할 수 있는 전문성을 갖춘 팀은 극소수에 불과했습니다. 에이전트가 소스 코드와 가이드 기능 모두에 액세스할 수 있으면 엔지니어에게 쉬운 언어로 변경 사항을 안내할 수 있습니다. 예를 들어 새로운 모델 클래스 추가, 백테스팅 로직 조정, 비즈니스 맞춤형 정확도 지표 통합 등을 안내할 수 있습니다. 한때 깊은 프레임워크 지식이 필요했던 수정 작업이 이제 훨씬 더 많은 엔지니어들이 접근할 수 있는 작업이 됩니다.

시작하기

MMF 및 MMF Agent는 지금 바로 사용할 수 있습니다. MMF Agent 기술은 Many Model Forecasting GitHub 리포지토리에서 전체 워크플로를 다루는 문서 및 예제 노트북과 함께 제공됩니다. Genie Code 또는 로컬 에이전트 환경에 기술을 설치하면 어시스턴트가 알아서 처리해 줍니다.

이미 보유한 팀과 도구를 활용하여 더 나은 예측을 원하는 수요 계획 담당 리더라면, 한 시간 정도 시간을 내어 살펴보실 가치가 충분합니다.

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

최신 게시물을 이메일로 받아보세요

블로그를 구독하고 최신 게시물을 이메일로 받아보세요.