주요 컨텐츠로 이동
공지사항

이제 Databricks에서 Claude Fable 5를 사용할 수 있으며, Unity AI Gateway를 통해 완벽하게 거버넌스가 적용됩니다.

자율적 지식 작업을 위한 Anthropic의 가장 강력한 정식 출시 모델이 에이전트 기반 엔터프라이즈 벤치마크에서 새로운 최첨단 성능을 기록했습니다. 다음 주에 걸쳐 AWS, Azure, Google Cloud 전반의 Databricks에 출시될 예정입니다.

작성자: 아흐메드 빌랄, Ivan Zhou, Yash Oza, Gautam Venkatesh, Alice Li , 해리시 가우르

Anthropic의 가장 지능적인 정식 출시 모델인 Claude Fable 5를 이제 Databricks에서 사용할 수 있습니다.
Claude Fable 5는 엔터프라이즈 워크플로 자동화, 에이전트 검색, 데이터 추론, 멀티모달 문서 이해를 아우르는 내부 벤치마크 전반에서 최첨단 성능을 달성했습니다.
Databricks 고객은 중앙 집중식 거버넌스, 비용 제어, 관측 가능성을 지원하는 Unity AI Gateway를 통해 Claude Fable 5를 사용할 수 있습니다.

Databricks와 Anthropic은 가장 강력한 AI란 여러분의 가장 까다로운 문제, 여러분의 데이터, 그리고 여러분의 거버넌스 하에서 작동하는 AI라는 신념을 공유합니다. Anthropic 역사상 가장 지능적인 모델인 Claude Fable 5가 이제 정식 버전으로 제공되며, 향후 일주일 동안 Unity AI Gateway를 통해 AWS, Azure, Google Cloud 전반의 Databricks에 배포될 예정입니다.

Claude Fable 5는 이전에는 모델이 처리하기에 너무 복잡하거나, 실행 시간이 너무 길거나, 모호했던 문제를 해결하기 위해 설계된 Mythos 클래스 모델입니다. 이제 Fable 5는 이러한 작업뿐만 아니라 그 이상을 수행할 수 있으며, 사람이 처리하려면 몇 시간, 며칠, 심지어 몇 주가 걸릴 수 있는 엔드투엔드(end-to-end) 워크플로우를 완료할 수 있습니다.

Databricks에서 Fable 5에 대한 네이티브 액세스를 제공함으로써, 기업 데이터에 대해 직접 모델을 실행하고, 기존 도구 및 워크플로우에 연결하며, 조직이 이미 다른 모든 작업에 의존하고 있는 거버넌스를 바탕으로 그 위에 도메인 특화 에이전트를 구축할 수 있습니다.

에이전트 기반 엔터프라이즈 작업의 최첨단 성능(SoTA)

Claude Fable 5는 장기적 자율성(long-horizon autonomy), 복잡한 문제에 대한 첫 시도에서의 정확성(first-shot correctness), 병렬 서브 에이전트 간의 신뢰할 수 있는 위임을 위해 구축되었습니다. Databricks는 기업이 직면한 가장 까다로운 에이전트 및 문서 AI 작업을 다루는 세 가지 내부 벤치마크를 통해 Claude Fable 5를 평가했습니다. 결과는 명확합니다. Fable 5는 복잡하고 자율적인 지식 작업을 위한 품질의 선두 주자입니다.

OfficeQA Pro — SoTA

파일 검색, 웹 검색, 코드 실행 및 멀티모달 문서 이해가 필요한 까다로운 문서 QA 작업에서 각 에이전트 하네스의 프론티어 모델을 테스트하는 OfficeQA Pro 벤치마크에서 Claude Fable 5는 57.9%의 정확도를 달성하며 새로운 최첨단 성능(SoTA)을 기록했습니다.

Claude Fable 5 벤치마크

Claude Opus 4.8과 비교했을 때, Fable 5는 정확도가 20% 더 높고 도구 호출을 12% 덜 사용합니다. 비록 약 30% 더 느리고 질문당 2.5배 더 많은 출력 토큰을 생성하지만, Fable 5는 효율성보다는 품질을 최우선으로 하는 모델입니다.

Databricks 고객을 위한 Claude Fable 5의 새로운 기능

Fable 5는 스스로 더 많은 일을 수행하도록 설계되었습니다. 즉, 사람의 개입을 최소화하면서 더 길고 복잡한 워크플로우를 더 높은 정확도로 처리합니다. 이것이 Databricks 고객에게 실제로 의미하는 바는 다음과 같습니다.

  • 엔터프라이즈 워크플로우를 위한 장기적 자율성: Fable 5는 장기간에 걸쳐 생산적인 결과물을 지속적으로 유지하며, 며칠 동안 지속되는 목표 지향적 실행을 성공적으로 완료합니다. Databricks 고객에게 이는 더 오랫동안 실행되고 사람의 개입이 덜 필요한 AI 기반 워크플로우를 의미합니다.
  • 복잡한 문제에 대한 첫 시도에서의 정확성: 초기 테스터들은 이전에는 며칠 동안 반복 작업이 필요했던 시스템을 단 한 번의 시도만으로 구현했다고 보고했습니다. 데이터 파이프라인, 분석 워크플로우 또는 AI 애플리케이션을 구축하는 Databricks 고객에게 이는 프로덕션 도달 시간(time-to-production)의 단축으로 직결됩니다.
  • 더 강력해진 코드 검토 및 조사: 버그 탐지 재현율(recall)이 Opus 4.8보다 눈에 띄게 높습니다. 장애 분류(outage triage), 리포지토리 이력 조사, 복잡한 디버깅 성능도 유사하게 향상되어, Fable 5는 Databricks를 사용하는 엔지니어링 팀에 강력한 선택지가 될 것입니다.
  • 병렬 서브 에이전트에 대한 신뢰할 수 있는 위임: Fable 5는 병렬 서브 에이전트를 배치하고 유지하는 데 있어 이전 모델보다 훨씬 더 신뢰할 수 있으며, 이는 Databricks Agent Bricks를 기반으로 구축된 복잡한 에이전트 워크플로우에 매우 중요한 기능입니다.
  • 고품질 비전 기능: Fable 5는 복잡한 기술 이미지, 웹 애플리케이션, 상세한 스크린샷을 이전 모델보다 훨씬 더 높은 정확도로 해석하여 Databricks에서 더 풍부한 문서 AI 및 멀티모달 워크플로우를 가능하게 합니다.

Unity AI Gateway로 Claude Fable 5에 안전하게 액세스하기

Fable 5는 Databricks의 다른 모든 모델과 마찬가지로 통합 API 및 Messages API 엔드포인트를 통해 Unity AI Gateway에서 액세스할 수 있습니다. 관리자는 세분화된 권한 설정을 통해 이를 호출할 수 있는 사용자, 팀, 서비스 주체(service principal)를 제어할 수 있습니다. 모든 요청과 응답은 Unity Catalog에 기록되어 조직 전체의 사용량에 대한 쿼리 가능한 완전한 감사 추적(audit trail)을 제공합니다. 또한 인터페이스가 표준화되어 있으므로 애플리케이션 코드를 변경하지 않고도 Fable 5를 다른 모델로 교체할 수 있습니다.

Unity AI Gateway

에이전트 자율성에 맞춘 가드레일 확장

Fable 5는 단순히 개별 프롬프트에 응답하는 것을 넘어 작업을 엔드투엔드로 완료하도록 설계되었습니다. 최소한의 개입만으로 몇 시간 동안 실행되고, 병렬 서브 에이전트를 조정하며, 여러 도구와 시스템 전반에서 작업을 수행합니다. 이러한 수준의 자율성이 바로 가치를 창출하는 요소이며, 인프라 내의 거버넌스는 팀이 이를 대규모로 안심하고 배포할 수 있도록 지원합니다. Databricks는 두 가지 제어 레이어를 제공합니다.

  • 모든 LLM 호출에 가드레일 적용. Unity AI Gateway는 모델이 프롬프트를 보기 전에 모든 요청에 대해, 그리고 사용자에게 도달하기 전에 모든 응답에 대해 가드레일을 적용하여 PII, 탈옥(jailbreak) 시도, 안전하지 않은 콘텐츠 및 정의된 맞춤형 비즈니스 규칙을 차단합니다. 모든 작업은 추론 테이블(inference table)을 통해 Delta에 기록됩니다.
  • 모든 도구 호출로 가드레일 확장. Unity AI Gateway 서비스 정책은 실행 전에 모든 도구 호출을 평가합니다. 예를 들어, delete_file을 완전히 차단하거나, drop_table을 관리자로만 제한하거나, 쓰기 작업 전에 명시적인 동의를 요구할 수 있습니다. 모든 작업은 결과에 관계없이 Delta 테이블에 기록됩니다.

대규모로 Fable 5 비용 추적 및 최적화하기

Fable 5의 장기 실행은 일반적인 모델 호출보다 훨씬 더 많은 토큰을 소비하며, AI 워크로드의 실패 방식은 기존 클라우드 예산 관리 도구로는 감지하기 어렵습니다. AI Spend Controls인 Unity AI Gateway를 사용하면 플랫폼 팀이 사용자별, 사용 사례별, 워크스페이스별, 계정별 임계값을 설정하고 한도에 도달하기 전에 알림을 받을 수 있습니다. 비용 분석(Cost Analytics) 대시보드는 모델, 제공업체, 워크스페이스, 사용자별로 비용을 세분화하여 보여주므로 도입 규모가 커짐에 따라 팀에 완전한 가시성을 제공합니다.

도메인 특화 장기 실행 에이전트 구축

Agent Bricks를 사용하면 팀은 자체 데이터를 기반으로 하고, 도구에 연결되며, 실제 워크플로우에서 시간의 흐름에 따라 평가 및 개선되는 도메인 특화 에이전트를 Fable 5 상에 구축할 수 있습니다. 이를 통해 Fable 5의 기능이 비즈니스 목적에 맞게 맞춤화된 솔루션으로 전환됩니다.

구축된 에이전트는 Databricks Apps로 배포됩니다. 이는 완전 관리형 서버리스 환경으로, 내장된 인증, 액세스 제어 및 Lakebase 기반 메모리를 제공하여 에이전트가 세션 간에 컨텍스트를 유지할 수 있도록 합니다. 그 결과, 조직이 이미 신뢰하고 있는 인프라에 배포되어 정책에 따라 제어되고 데이터에 연결된, 현존하는 가장 유능한 모델 기반의 도메인 특화 에이전트가 탄생합니다.

안전을 위한 데이터 보존

향상된 모델 기능을 고려하여, 당사는 신뢰 및 안전 목적에 한해 30일간 데이터를 보존하는 Anthropic의 Fable 5 모델에 대한 새로운 데이터 보존 정책을 준수합니다(자세한 데이터 보존 정책은 Anthropic 발표 블로그를 참조하세요).

Databricks에서 Claude Fable 5 시작하기

Claude Fable 5는 현재 Databricks Marketplace 및 Unity AI Gateway를 통해 AWS, Azure, Google Cloud 전반의 Databricks에 배포되고 있습니다.

  • AI Playground에서 Fable 5 사용해 보기: 현재 Databricks Marketplace에서 제공 중
  • Unity AI Gateway 구성: Databricks 워크스페이스에서 거버넌스, 비용 제어 및 폴백(fallback) 설정
  • 자세히 알아보기: Agent Bricks: Databricks에서 Fable 5 기반의 장기 실행 자율 에이전트 구축
  • 계정 담당 팀에 문의하기: 엔터프라이즈 액세스, 안전 분류기 가이드 또는 Opus 4.8 마이그레이션 지원 관련

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

최신 게시물을 이메일로 받아보세요

블로그를 구독하고 최신 게시물을 이메일로 받아보세요.