작성자: 라피 컬란식, 개빈 에글리 , Sara Steffen
적시에 딱 맞는 고객 사례를 찾는 것은 생각보다 훨씬 어렵습니다. 직원 생산성을 개선하기 위해 2,400개 이상의 Databricks 고객 레퍼런스를 검색하고 분석하여 개인화된 응답, 교차 사례 분석, 인용문 등을 제공하는 앱인 Reffy를 구축했습니다. 출시 후 첫 두 달 동안 Databricks 영업 및 마케팅 부서의 1,800명 이상이 Reffy에서 7,500건 이상의 쿼리를 실행했습니다. 이는 더 관련성 있고 일관된 스토리텔링, 더 빠른 캠페인 실행, 그리고 고객 증거가 대규모로 사용된다는 확신으로 이어집니다. 이러한 사례를 검색하고 이해하기 쉽게 만들어 고객 레퍼런스를 둘러싼 파편화된 지식 문제를 해결하고 수년간 이를 수집해 온 많은 사람들의 귀중한 작업을 활용할 수 있게 되었습니다.
이 아티클에서는 Reffy를 개발하게 된 동기, 완전한 Databricks 솔루션으로서 Reffy가 조직에 미친 영향, 그리고 앞으로 내부적으로 Reffy를 더욱 확장할 계획에 대해 자세히 알아봅니다.

"다른 사람도 이걸 했나요?"는 모든 판매자가 듣는 질문입니다. 잠재 고객이 귀사의 발표에 흥 미를 보이지만, 다음 단계로 나아가기 전에 증거, 즉 자신들과 비슷하게 이미 이 길을 걸어본 고객 사례를 원합니다. 쉽게 답할 수 있어야 합니다.
마케팅팀에게 고객 사례는 캠페인, 제품 출시, 광고, PR, 애널리스트 브리핑, 경영진 커뮤니케이션 등 거의 모든 활동의 핵심적인 자료입니다. 이러한 사례를 쉽게 찾거나 평가할 수 없으면 가치 높은 레퍼런스가 과도하게 사용되고, 새로운 사용 사례나 산업을 놓치게 되며, 마케팅 효과는 소수만 아는 지식에 의해 제한되는 등 실제 문제가 복합적으로 발생합니다.
Databricks에는 수천 개의 YouTube 강연, databricks.com의 사례 연구, 내부 슬라이드, LinkedIn 기사, Medium 게시물이 있습니다. 그 어딘가에는 캐나다에서 실시간 사기 탐지를 수행하는 금융 서비스 회사, 레거시 데이터 웨어하우스를 교체한 소매업체, GenAI를 확장하는 제조업체와 같은 완벽한 레퍼런스가 있습니다. 하지만 그것을 찾는 것은요? 바로 그 지점에서 일이 어그러집니다. 사례들은 통합 검색 기능 없이 수십 개의 플랫폼에 흩어져 있으며, 무언가를 찾더라도 그것이 신뢰할 수 있는 비즈니스 성과를 담고 있는지 아니면 모호한 주장뿐인지 즉시 알 수 없습니다.
그래서 사람들은 으레 하던 대로 합니다. Slack으로 마케팅팀에 메시지를 보내고, 어렴풋이 기억나는 폴더를 뒤지거나, 누군가 쓸 만한 것을 찾아낼 때까지 주변에 물어봅니다. 때로는 골드를 찾기도 합니다. 하지만 더 자주 '이만하면 괜찮다'며 타협하거나, 완벽한 스토리가 어딘가에 있었을지도 모른다는 사실을 알지 못한 채 완전히 포기해 버립니다.
분명히 영업 및 마케팅팀이 가장 관련성 높은 고객 사례를 찾을 수 있는 더 나은 방법이 필요했습 니다.
이 문제를 해결하기 위해 저희는 모든 사례를 단일 테이블로 통합하고 분류한 다음, RAG 기반 에이전트를 사용하여 검색 기능을 강화하며, 이 모든 것은 분위기에 맞게 코딩된 Databricks 앱을 통해 제공됩니다. 이 아키텍처는 전체 Databricks 플랫폼에 걸쳐 있습니다. 즉, Lakeflow Jobs는 ETL 파이프라인을 오케스트레이션하고, Unity Catalog는 데이터를 거버넌스하며, Vector Search는 검색을 지원하고, Model Serving은 에이전트를 호스팅하며, Lakebase는 실시간 읽기 및 쓰기를 처리하고, Databricks Apps는 프런트엔드를 제공합니다. 자세한 내용을 살펴보겠습니다.
데이터 소스 및 ETL

파이프라인은 Lakeflow Jobs로 오케스트레이션되는 일련의 Databricks Notebook으로 정의됩니다. 파이프라인은 모든 데이터 소스에서 스토리 텍스트를 수집하는 것으로 시작됩니다. 표준 Python 웹 스크래핑 라이브러리를 사용하여 YouTube 스크립트, LinkedIn/Medium 기사 및 databricks.com의 모든 공개 고객 사례를 수집합니다. 또한 Google Apps 스크립트를 사용하여 수백 개의 내부 Google 슬라이드와 문서의 텍스트를 단일 Google Sheet로 통합합니다. 이 모든 소스는 기본 메타데이터로 처리되어 Unity Catalog(UC)의 'Bronze' Delta Lake 테이블에 저장됩니다.