검색 증강 생성(RAG) 은 Gen AI 애플리케이션에서 관련 데이터를 컨텍스트로 제공하는 효율적인 메커니즘입니다. 대부분의 RAG 애플리케이션은 일반적으로 벡터 인덱스를 사용하여 문서, 위키, 지원 티켓과 같은 비정형 데이터에서 관련 컨텍스트를 검색합니다. 어제 저희는 바로 이러한 작업을 지원하는 Databricks 벡터 검색 퍼블릭 프리뷰를 발표했습니다. 하지만 이러한 텍스트 기반 컨텍스트를 관련성 있고 개인화된 정형 데이터로 보강하면 Gen AI 응답 품질을 향상시킬 수 있습니다. 고객이 "최근 주문은 어디에 있나요?"라고 문의하는 리테일 웹사이트의 Gen AI 도구를 상상해 보세요. 이 AI는 쿼리가 특정 구매에 관한 것임을 이해한 다음, LLM을 사용하여 응답을 생성하기 전에 개별 품목에 대한 최신 배송 정보를 수집해야 합니다. 이러한 확장 가능한 애플리케이션을 개발하려면 정형 데이터와 비정형 데이터를 모두 처리하는 기술을 Gen AI 기능과 통합하는 상당한 작업이 필요합니다.
Databricks Data Intelligence Platform에서 정형 데이터를 제공하기 위한 저지연 실시간 서비스인 Databricks Feature & Function Serving의 공개 미리보기를 발표하게 되어 기쁩니다. Unity Catalog의 모든 Python 함수를 제공하여 사전 계산된 ML 특성에 즉시 액세스하고 실시간 데이터 변환을 수행할 수 있습니다. 검색된 데이터는 실시간 규칙 엔진, 고전적 ML 및 Gen AI 애플리케이션에서 사용될 수 있습니다.
구조화된 데이터에 Feature and Function Serving(AWS)(Azure)을 사용하고, 비정형 데이터에 Databricks Vector Search(AWS)(Azure)를 함께 사용하면 Gen AI 애플리케이션의 프로덕션화가 크게 단순화됩니다. 사용자는 Databricks에서 직접 이러한 애플리케이션을 구축하고 배포할 수 있으며, 기존 데이터 파이프라인, 거버넌스 및 기타 엔터프라이즈 기능을 활용할 수 있습니다. 다양한 산업 분야의 Databricks 고객들은 오픈 소스 프레임워크와 함께 이러한 기술을 사용하여 아래 표에 설명된 것과 같이 강력한 Gen AI 애플리케이션을 구축하고 있습니다.
| 업종 | 사용 사례 |
| 리테일 |
|
| 교육 |
|
| 금융 서비스 |
|
| 여행 및 숙박 |
|
| 의료 서비스 및 생명 공학 |
|
| 보험 |
|
