2026년 5월 19일

Unity AI Gateway의 새로운 기능: AI 에이전트 및 MCP를 위한 서비스 정책, 가드레일, 관찰 가능성 및 비용 제어

AI 에이전트 및 MCP가 작동하는 방식, 액세스하는 내용, 비용을 제어하는 방법을 한 곳에서 관리하세요.

• Unity AI Gateway는 단일 통합 계층에서 서비스 정책, LLM 가드레일, 페이로드 로깅 및 비용 제어를 통해 런타임 AI 거버넌스를 확장합니다.
• 팀은 AI가 모델 및 도구 전반에 걸쳐 확장됨에 따라 에이전트 동작 제어, 안전 보장, 가시성 확보 및 비용 관리에 어려움을 겪습니다.
• 조직은 일관된 정책, 완전한 관찰 가능성 및 시행 가능한 비용 제어를 통해 모든 모델 호출 및 에이전트 작업을 관리하여 안전하고 프로덕션 준비된 AI를 확장 가능하게 구현할 수 있습니다.

AI 에이전트가 빠르게 프로덕션 환경으로 전환되고 있지만, AI 거버넌스는 이를 따라가지 못하고 있습니다. 팀들은 비용 증가, 불분명한 에이전트 동작, 그리고 에이전트가 도구 및 모델과 상호 작용하는 방식에 대한 제한된 제어에 직면해 있습니다.

이것이 바로 저희가 Unity AI Gateway를 구축한 이유입니다. 모든 모델 호출, 도구 호출, 에이전트 상호 작용에 런타임 거버넌스를 제공하기 위해서입니다. Unity Catalog의 일부인 Unity AI Gateway는 전체 AI 환경에 걸쳐 거버넌스를 시행할 수 있는 단일 장소입니다.

Unity AI Gateway가 현재 베타 버전으로 제공되는 네 가지 주요 영역에 걸쳐 AI 거버넌스 기능을 확장하고 있음을 발표하게 되어 기쁩니다:

LLM 가드레일: 모델 입력 및 출력에 사용자 정의 가능한 안전 및 규정 준수 정책 적용
비용 제어: 여러 모델 및 제공업체에 걸쳐 사용량 모니터링 및 사용자별 알림 설정
MCP용 페이로드 로깅: 완전한 관찰 가능성을 위해 전체 요청 및 응답 데이터 캡처
MCP용 서비스 정책: ID 및 요청 컨텍스트를 기반으로 에이전트가 호출할 수 있는 도구 제어

유연하고 프로덕션 준비된 AI 안전을 위한 LLM 가드레일 적용

Unity AI Gateway는 모델과 프롬프트를 사용하여 정의되고 실시간으로 평가되는 정책으로 경직된 사전 구축 필터를 대체하는 LLM 기반 가드레일을 도입합니다.

이를 통해 팀은 에이전트 워크플로우를 중단하지 않고 사용 사례에 맞춰 안전, PII 보호 및 비즈니스별 규칙을 시행할 수 있습니다. 가드레일은 입력, 출력 또는 둘 다에 적용될 수 있어 모델 동작이 정의된 경계 내에 유지되도록 합니다.

Unity Catalog로의 중앙 집중식 로깅을 통해 팀은 프로덕션에서 가드레일이 어떻게 적용되는지에 대한 완전한 가시성을 확보할 수 있습니다.

“에이전트 AI와 의료 데이터셋의 통합이 심화되면서 고객에게 더 풍부한 인사이트를 제공할 수 있는 새로운 기회가 생기고 있지만, 강력한 거버넌스, 보안 및 규정 준수의 필요성도 증가하고 있습니다. 저희는 Databricks와의 파트너십을 심화하게 된 것을 기쁘게 생각하며, Unity AI Gateway를 활용하여 모델, 에이전트 및 도구 전반에 걸쳐 AI 시스템을 안전하고 확장 가능하게 관리할 수 있기를 기대합니다.” — Erik Meijer, 부사장, 엔지니어링, Definitive Healthcare

“Unity AI Gateway는 저희의 분석 및 에이전트 이니셔티브를 위한 중요한 인프라가 되고 있습니다. 이는 통합된 거버넌스, 단순화된 아키텍처, 그리고 처음부터 끝까지 보안을 통해 프로덕션 AI를 확장하면서 신속하게 혁신할 수 있도록 지원할 것입니다. 이는 더 빠른 배포, 더 높은 품질, 그리고 더 낮은 위험을 의미합니다.” — Jeff Hepburn, 데이터 및 AI 플랫폼 수석 이사, Ibotta

사용자별 알림 및 예산 한도로 AI 지출 제어

모델 및 제공업체 전반에 걸쳐 AI 사용량이 증가함에 따라 비용은 빠르게 예측 불가능해질 수 있습니다.

Unity AI Gateway는 토큰 수준 비용 속성(요청, 사용자 및 엔드포인트별)을 포함한 비용 제어(베타) 기능을 도입하며, 이 모든 것은 Unity Catalog에 의해 관리되는 추론 테이블에 기록됩니다.

팀은 사용자별 알림을 설정하고 엄격한 예산 한도를 적용하여 사용량이 정의된 임계값을 초과하면 자동으로 제어가 적용되도록 할 수 있습니다. 이는 통제 불능의 비용을 방지하고 AI 사용량이 비즈니스 예산과 일치하도록 유지하는 데 도움이 됩니다.

“Quartile에서 Databricks는 저희 팀의 AI 코딩 에이전트 작업이 거버넌스되고 프로덕션 준비된 기능으로 전환되는 허브입니다. 개발은 이러한 도구에 의해 가속화되고, Databricks는 자산을 중앙 집중화하여 Unity Catalog 함수 및 MCP로 데이터를 노출하며, 에이전트는 프로덕션에서 이를 호출합니다. 리스팅 최적화와 같은 파이프라인에서는 사용 사례별로 LLM을 전환하여 비용과 품질을 지속적으로 조정합니다.” — Wilson Jacobsen, 데이터 인텔리전스 이사, Quartile

Unity Catalog의 페이로드 로깅으로 모든 상호 작용 캡처

에이전트가 수행하는 작업을 이해하는 것은 디버깅, 모니터링 및 규정 준수에 중요합니다.

페이로드 로깅을 통해 Unity AI Gateway는 모델 호출 및 MCP 상호 작용 전반에 걸쳐 모든 요청과 응답을 캡처합니다. 추론 테이블을 활성화함으로써 이러한 로그는 Unity Catalog에서 관리하는 시스템 테이블로 자동 저장되어 에이전트 활동에 대한 중앙 집중식 쿼리 가능한 기록을 생성합니다.

이는 에이전트 시스템을 완전히 관찰 가능한 워크플로우로 전환하여 문제를 디버깅하고, 동작을 감사하며, 규정 준수 요구 사항을 충족하기 쉽게 만듭니다. 페이로드 로깅 활성화에 관심이 있으시면 Databricks 계정 팀에 문의하여 제한된 베타에 등록하십시오.

MCP용 서비스 정책으로 에이전트 작업 제어

MCP는 이제 Unity Catalog(UC)에서 관리할 수 있으며, 관리자는 누가 어떤 MCP를 호출할 수 있는지 정의할 수 있습니다. 또한 관리자는 서비스 상호 작용을 더욱 제한하는 정책을 작성할 수 있습니다. 예를 들어, 에이전트가 사용자 대신 작동하는 경우입니다. 이러한 정책은 모든 서비스 호출을 가로채는 Unity AI Gateway에 의해 시행됩니다.

정책은 에이전트 ID, 사용자 컨텍스트 및 요청 매개변수를 기반으로 정의할 수 있습니다. 예를 들어, 에이전트가 매우 민감한 문서에 액세스하는 것을 제한하거나, 사용자 소유 파일에 대한 쓰기 작업을 제한하거나, 민감한 작업을 수행하기 전에 승인을 요구할 수 있습니다.

정책은 SQL로 UC 함수로 정의되고 MCP에 직접 적용되어 결정론적이고 감사 가능하며 모든 에이전트 워크플로우에서 쉽게 시행될 수 있습니다. MCP 및 서비스 정책에 관심이 있으시면 Databricks 계정 팀에 문의하여 제한된 베타에 등록하십시오.

Data + AI Summit 2026에서 팀을 만나고 자세히 알아보세요

위에 설명된 새로운 기능은 베타 버전으로 제공됩니다. 시작하려면 워크스페이스를 열고 Unity AI Gateway로 이동하여 AI 환경 관리를 시작하십시오.

자세한 내용은 문서 또는 자세한 설명 블로그 게시물에서 확인하십시오:

Data + AI Summit 2026에서 Unity AI Gateway가 작동하는 것을 보고 선도적인 조직이 AI 에이전트를 확장 가능하게 관리하는 방법을 알아보십시오. 지금 등록하세요!

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)