주요 컨텐츠로 이동

Mosaic AI Vector Search에서의 재정렬을 통한 더 빠르고 똑똑한 검색을 위한 RAG 에이전트

한 줄의 코드로 더 관련성 있는 답변을 더 적은 시간에 제공하세요

Reranking in Vector Search

Summary

  • 즉각적인 에이전트 품질 향상을 위한 한 줄 코드 변경: 벡터 검색 쿼리에 단일 매개변수를 추가하여 우리의 엔터프라이즈 벤치마크에서 평균 15 퍼센트 포인트의 에이전트 품질을 향상시킵니다.
  • 에이전트와의 원활한 통합: LangChain 및 기타 프레임워크에 대한 네이티브 지원, 더 풍부한 컨텍스트를 위한 다중 열 재정렬, 내장 성능 메트릭스.
  • 일관된 성능 규모: 독특한 병렬 재정렬 아키텍처는 50개의 문서에 대해 1.5초의 지연 시간을 달성하면서 매우 높은 관련성을 제공하며, 선두 클라우드 대안을 능가합니다.

많은 조직들에게, 비구조화된 데이터 위에 구축된 AI 에이전트의 가장 큰 도전은 모델이 아니라 그것의 맥락입니다. 에이전트가 올바른 정보를 검색하지 못하면, 가장 진보된 모델도 핵심 세부사항을 놓치고 불완전하거나 잘못된 답변을 제공할 것입니다.

이제 공개 미리보기에서 Mosaic AI Vector Search의 재정렬을 소개합니다. 단일 매개변수로, 우리의 엔터프라이즈 벤치마크에서 평균 15 퍼센트 포인트의 검색 정확도를 향상시킬 수 있습니다. 이는 추가적인 인프라나 복잡한 설정 없이도 더 높은 품질의 답변, 더 나은 추론, 그리고 더 일관된 에이전트 성능을 의미합니다.

재정렬이란 무엇인가요?

재정렬은 에이전트가 작업을 수행하기 위해 가장 관련성 있는 데이터를 얻도록 보장함으로써 에이전트의 품질을 향상시키는 기술입니다. 벡터 데이터베이스는 수백만 개의 후보 중에서 관련 문서를 빠르게 찾는 데 뛰어나지만, 재정렬은 더 깊은 문맥 이해를 적용하여 가장 의미론적으로 관련된 결과가 상위에 표시되도록 합니다. 이 두 단계 접근법—빠른 검색 다음에 지능적인 재정렬—은 품질이 중요한 RAG 에이전트 시스템에서 필수적이게 되었습니다.

왜 우리는 재정렬을 추가했는가

당신은 문서에 대한 질문에 답변하는 내부적으로 사용되는 채팅 에이전트를 구축하고 있을 수 있습니다. 또는 고객을 위한 보고서를 생성하는 에이전트를 구축하고 있을 수 있습니다. 어쨌든, 비구조화된 데이터를 정확하게 사용할 수 있는 에이전트를 구축하려면 품질이 검색과 연결되어 있습니다. 재정렬은 Vector Search 고객이 검색의 품질을 향상시키고 따라서 RAG 에이전트의 품질을 향상시키는 방법입니다.

고객 피드백에서, 우리는 두 가지 공통적인 문제를 발견했습니다:

  • 에이전트는 대량의 비구조화된 문서에 묻혀 있는 중요한 맥락을 놓칠 수 있습니다. "올바른" 구절은 벡터 데이터베이스에서 검색된 결과의 맨 위에 거의 없습니다.
  • 직접 개발한 재정렬 시스템은 에이전트의 품질을 크게 향상시키지만, 구축하는 데 몇 주가 걸리고 그 후에도 상당한 유지 관리가 필요합니다.

재순위를 기본 벡터 검색 기능으로 만들면, 추가 엔지니어링 없이 가장 관련성 있는 정보를 표면화하는 데 귀사의 관리된 엔터프라이즈 데이터를 사용할 수 있습니다.

재정렬 기능은 우리의 Lexi 채팅봇이 고등학생처럼 작동하는 것에서 법학 학위를 가진 졸업생처럼 작동하도록 향상시켰습니다. 우리는 법률 문서에서 내용을 이해하고, 이유를 제시하고, 생성하는 방식에서 변혁적인 성과를 보았습니다-이전에는 비구조화된 데이터에 묻혀 있던 통찰력을 해제했습니다. — David Brady, G3 Enterprises의 Senior Director

기준선에 비해 상당한 품질 향상

우리의 연구 팀은 에이전트 작업을 위한 새로운 복합 AI 시스템을 구축함으로써 돌파구를 이루었습니다. 우리의 엔터프라이즈 벤치마크 에서, 시스템은 89%의 시간 동안 상위 10개 결과 내에서 정확한 답변을 검색합니다 (recall@10), 이는 우리의 기준선 (74%)보다 15포인트 향상되었고, 선두 클라우드 대안 (79%)보다 10포인트 높습니다. 중요한 것은, 우리의 재정렬기는 이런 품질을 1.5초만에 제공하는 반면, 현대의 시스템들은 종종 몇 초 또는 심지어 몇 분이 걸려서 고품질의 답변을 반환합니다.

엔터프라이즈 벤치마크
Enterprise benchmark showing recall@10 improvements with reranking

쉽고, 고품질 검색

몇 주가 아닌 몇 분 안에 엔터프라이즈 등급의 재정렬을 가능하게 합니다. 팀들은 일반적으로 모델을 연구하고, 인프라를 배포하고, 사용자 정의 로직을 작성하는 데 주를 보냅니다. 반면에, 벡터 검색에 대한 재순위를 활성화하는 것은 벡터 검색 쿼리에 추가 매개변수 하나만 필요로 하여 즉시 에이전트에게 더 높은 품질의 검색을 제공합니다. 관리해야 할 모델 서빙 엔드포인트가 없고, 유지해야 할 사용자 정의 래퍼가 없으며, 조정해야 할 복잡한 구성이 없습니다.

columns_to_rerank에 여러 열을 지정함으로써, 당신은 주요 텍스트 이상의 메타데이터에 접근할 수 있게 하여 재정렬기의 품질을 다음 단계로 끌어올립니다. 이 예에서, 재정렬기는 계약 요약과 카테고리 정보를 사용하여 맥락을 더 잘 이해하고 검색 결과의 관련성을 향상시킵니다.

에이전트 성능 최적화

실시간 AI, 에이전트 애플리케이션을 위한 속도와 품질의 만남. 우리의 연구 팀은 이 복합 AI 시스템을 최적화하여 1.5초 만에 50개의 결과를 재정렬합니다. 이로 인해 정확성과 반응성을 모두 요구하는 에이전트 시스템에 매우 효과적입니다. 이 돌파구 성능은 사용자 경험을 저해하지 않고 복잡한 검색 전략을 가능하게 합니다.

언제 재정렬을 사용해야 할까요?

우리는 어떤 RAG 에이전트 사용 사례에 대해서도 재정렬을 테스트하는 것을 권장합니다. 일반적으로, 고객들은 현재 시스템이 검색 결과 상위 50개 중에서는 올바른 답변을 찾지만, 상위 10개 내에 표시하는 데 어려움을 겪을 때 품질 향상을 크게 볼 수 있습니다. 기술적인 용어로는, 이는 낮은 recall@10 하지만 높은 recall@50을 가진 고객을 의미합니다.

향상된 개발자 경험

핵심 재정렬 기능을 넘어서, 우리는 고품질 검색 시스템을 구축하고 배포하는 것을 어느 때보다 쉽게 만들고 있습니다.

LangChain 통합: 재정렬기는 VectorSearchRetrieverTool, 우리의 공식 LangChain 통합 Vector Search와 원활하게 작동합니다. VectorSearchRetrieverTool로 RAG 에이전트를 구축하는 팀들은 코드 변경 없이 더 높은 품질의 검색을 얻을 수 있습니다.

투명한 성능 지표: 재순위 지연이 이제 쿼리 디버그 정보에 포함되어, 쿼리 성능의 완전한 종단 간 분석을 제공합니다.

밀리초 단위의 응답 지연 분석

유연한 열 선택: 텍스트와 메타데이터 열의 모든 조합을 기반으로 재정렬하므로, 문서 요약부터 카테고리, 사용자 정의 메타데이터에 이르기까지 모든 사용 가능한 도메인 컨텍스트를 활용하여 높은 관련성을 달성할 수 있습니다.

오늘부터 구축 시작하세요

Vector Search에서의 재정렬기는 AI 애플리케이션을 구축하는 방식을 변화시킵니다. 인프라 오버헤드 없이 원활한 통합을 통해, 사용자가 원하는 검색 품질을 마침내 제공할 수 있습니다.

시작할 준비가 되셨나요?

 

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요