Ir al contenido principal

Ampliando la gobernanza de agentes con Unity AI Gateway

Controle y audite agentes de IA y asistentes de codificación con gobernanza, visibilidad y barreras de seguridad unificadas

Unity AI Gateway

Publicado: 15 de abril de 2026

Producto7 min de lectura

Summary

  • Ahora compatible con la gobernanza de MCP: controle a qué agentes pueden acceder a sistemas externos con permisos detallados, incluido el acceso "en nombre de" (OBO).
  • Observabilidad de extremo a extremo para agentes: supervise las llamadas a LLM y MCP, supervise el uso y atribuya los costos entre modelos, equipos y flujos de trabajo.
  • Acceso a modelos más flexible y confiable: use una API unificada en todos los modelos con fallas de respaldo, límites de tasa y barreras de seguridad integrados.

Hoy, anunciamos importantes mejoras en AI Gateway. Como parte de este lanzamiento, AI Gateway ahora forma parte de Unity Catalog como Unity AI Gateway. Esto extiende el modelo de gobernanza de Unity Catalog a la IA agentiva, para que pueda aplicar los mismos permisos, auditorías y controles de políticas a cómo los agentes acceden a los LLM e interactúan con herramientas como servidores MCP y API.

Esto es lo que sucede cuando un agente de IA responde a una pregunta de un cliente: llama a un LLM para interpretar la consulta, extrae el historial de pedidos de Salesforce a través de un servidor MCP, verifica los datos de envío en tiempo real a través de una API interna y luego vuelve a llamar al LLM para redactar una respuesta. Tiempo total: menos de un segundo. Visibilidad total de quién accedió a qué datos, qué sistemas se llamaron y si se siguieron las políticas: casi ninguna.

Lo que ha cambiado no son solo las herramientas, sino la arquitectura. Los agentes de IA ahora orquestan flujos de trabajo de varios pasos a través de modelos y sistemas, a menudo tocando datos confidenciales en cada paso. Eso podría significar consultar una base de datos, llamar a una API externa o usar agentes de codificación como Cursor, Codex o Claude Code para generar o modificar código.

Y eso plantea nuevas preguntas: ¿Quién autorizó cada acción? ¿Qué datos se compartieron con qué modelo? ¿Se aplicaron las políticas de manera consistente? Si algo falla, ¿puede rastrear la cadena completa?

Las herramientas de gobernanza tradicionales no se crearon para este mundo. Operan en silos y no pueden proporcionar una vista unificada de todo el ciclo de vida de las acciones de un agente.

Con este lanzamiento, estamos expandiendo las capacidades de gobernanza de Unity Catalog para cubrir los agentes de IA. Unity AI Gateway le permite controlar el acceso a LLM, gobernar cómo los agentes usan los servidores y API de MCP, y aplicar políticas consistentes en todos los modelos y herramientas. Esto incluye nuevo soporte para la gobernanza de MCP, para que pueda controlar qué agentes pueden acceder a qué sistemas externos y rastrear cómo se utilizan esos datos. Para una mirada más profunda, lea nuestra publicación de blog de cómo hacerlo sobre cómo conectar agentes a MCP externos de forma segura.

También obtiene observabilidad detallada tanto en las llamadas a LLM como a MCP, junto con un seguimiento de costos granular en todos los modelos, equipos y flujos de trabajo. Además, Unity AI Gateway proporciona una forma unificada de trabajar en todos los modelos, con fallas automáticas, límites de tasa y barreras de protección integradas para ayudarlo a ejecutar agentes de manera confiable en producción.

Algunas de las capacidades descritas a continuación están disponibles en Beta

AI Gateway landing page

Ahora puede configurar un nuevo punto final de LLM o servidor MCP en segundos: elija su modelo (Claude Opus 4.6, GPT-4, Gemini, Llama o cualquier API nativa del proveedor) y configure la gobernanza una vez. El mismo marco se aplica a los modelos de Anthropic, OpenAI, Google y de código abierto.

Dele a su equipo de soporte un punto final de Claude para IA conversacional. Use GPT-4 para la extracción de datos estructurados. Equipe a sus ingenieros con Codex o Claude para agentes de codificación. Incorpore Gemini para flujos de trabajo multimodales. Puede elegir el modelo adecuado para cada tarea sin tener que rehacer la gobernanza cada vez. Las políticas se mantienen consistentes entre los proveedores, sin configuración duplicada ni configuraciones separadas que administrar.

AI Gateway endpoint configuration

Permisos detallados y barreras de protección

Los permisos detallados y las barreras de protección evitan que ocurra lo que no debería suceder en primer lugar.

Control de acceso granular para herramientas

Cuando los agentes llaman a los servidores MCP para acceder a sistemas internos, Unity AI Gateway admite la ejecución en nombre del usuario. El MCP se ejecuta con los permisos exactos del usuario solicitante, no con una cuenta de servicio compartida. Si un usuario no puede acceder a un registro de Salesforce, tampoco puede hacerlo el agente, incluso con privilegios elevados.

Barreras de protección flexibles impulsadas por jueces LLM (Beta)

Las barreras de protección de Unity AI Gateway utilizan un enfoque de prompt + modelo: configúrelas para que se ejecuten en las solicitudes, las respuestas o ambas:

  • Detección y Redacción de PII: Detecta y enmascara correos electrónicos, SSN, números de teléfono antes de que lleguen a modelos externos
  • Seguridad del Contenido: Bloquea contenido tóxico, dañino o inapropiado con filtros personalizables
  • Detección de Inyección de Prompts: Detecta intentos de jailbreak que intentan anular las instrucciones del sistema
  • Prevención de Exfiltración de Datos: Evita la exposición de datos de entrenamiento o contenido propietario
  • Barrera contra Alucinaciones: Valida las respuestas contra fuentes de conexión a tierra
  • Barreras de Protección Personalizadas: Define las tuyas con un prompt y modelo personalizados

Cada barrera de protección está respaldada por un prompt editable y un modelo configurable, no por una lógica rígida predefinida. Cuando se infringe, Unity AI Gateway puede rechazar la solicitud o enmascarar datos confidenciales. Todas las acciones se registran para auditoría. Esta capacidad se está implementando actualmente y estará disponible en todas las regiones admitidas en la próxima semana.

Observabilidad de extremo a extremo

Tres equipos necesitan respuestas cuando los agentes de IA llegan a producción: FinOps quiere saber qué está costando dinero, ingeniería necesita depurar fallas, seguridad necesita rastros de auditoría. Unity AI Gateway brinda a cada equipo lo que necesita de la misma infraestructura de registro unificada.

AI Gateway Usage Analytics Dashboard

Para FinOps: Rastree los costos por lo que le importa

Cada solicitud se registra en las tablas del sistema de Unity Catalog con costos reales en dólares, no solo recuentos de tokens. El tiempo de actividad del rendimiento aprovisionado, el uso de pago por token y los precios de los modelos externos se calculan automáticamente. Divida los costos según lo presupueste su organización:

  • Etiquetas de punto final: Agrupe por equipo, entorno o centro de costos
  • Etiquetas de solicitud: Atribución dinámica para plataformas SaaS que actúan como proxy para clientes finales
  • Identidad: Agregue por usuario o principal de servicio, asigne el gasto a los propietarios del presupuesto
  • Modelo y proveedor: Rastree qué modelos (Opus vs Sonnet) y proveedores (Anthropic vs OpenAI) impulsan los costos

Para Ingeniería: Cargas útiles completas para depuración

Habilite las tablas de inferencia que capturan las cargas útiles completas de solicitud/respuesta, latencia, códigos de estado y errores en tablas Delta. Cuando un agente falla, rastree exactamente qué prompt se envió, qué devolvió el modelo y dónde falló, y use herramientas como Genie Code y MLflow para depurar y resolver problemas rápidamente.

AI Gateway Inference Tables

Para Seguridad: Pistas de auditoría completas

Cada solicitud registra la identidad solicitante, la marca de tiempo y, para las llamadas MCP, el nombre de la conexión, el método HTTP y si la llamada se realizó en nombre del usuario. Los permisos de Unity Catalog controlan quién ve qué.

Una única infraestructura de registro potencia tres casos de uso críticos, construida sobre tablas Delta que usted posee y controla.

Fiabilidad y flexibilidad para producción

Unity AI Gateway le brinda flexibilidad en cómo llama a los modelos, dependiendo de lo que necesite su aplicación.

API unificadas para un cambio de proveedor sin problemas (Beta)

Si la portabilidad es importante, y debería serlo, use la API compatible con OpenAI de Unity AI Gateway. Su código permanece igual en todos los proveedores. Escriba su aplicación una vez, luego cambie entre cualquier modelo actualizando la configuración del punto final. Sin cambios en el código, sin reimplantes.

La conmutación por error automática mantiene los sistemas en funcionamiento (Beta)

Configure modelos de respaldo, y Unity AI Gateway maneja las fallas automáticamente. Si su modelo principal alcanza los límites de tasa o devuelve errores, las solicitudes se enrutan a su modelo de respaldo en secuencia hasta que uno tenga éxito. ¿Cuota de Opus agotada? El tráfico se redirige a Sonnet. ¿El proveedor experimenta una interrupción? Su aplicación se enruta a una alternativa. Sin intervención manual, sin tiempo de inactividad.

Finalmente, Unity AI Gateway te permite establecer límites de tasa en el nivel de punto final, usuario o grupo para evitar costos descontrolados y proteger tu SLA antes de que comiencen los problemas.

AI Gateway Fallbacks
GUÍA

Tu guía compacta para el análisis moderno

Comienza con Unity AI Gateway

Las nuevas capacidades descritas anteriormente están disponibles en regiones compatibles de Databricks. Abre tu espacio de trabajo, navega a Unity AI Gateway en la barra lateral y comienza a gobernar tu pila de GenAI —LLMs y MCPs— desde un solo lugar. Obtén más información en la documentación y en la publicación del blog sobre cómo conectar agentes a MCPs externos de forma segura.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Never miss a Databricks post

Subscribe to our blog and get the latest posts delivered to your inbox