Ir al contenido principal
Anuncios

Novedades de Unity Catalog en el Data + AI Summit 2026

Unity AI Gateway, Glosario, direccionabilidad entre nubes y entre regiones, Governance Hub y mucho más

por The Unity Catalog Product and Engineering Team

Novedades de Unity Catalog de un vistazo:
*Gobernar lo que hacen los agentes de AI, no solo aquello a lo que acceden: Unity AI Gateway reúne modelos, agentes, herramientas y MCPs bajo una única capa de gobernanza en tiempo de ejecución.
*Proporcionar a los agentes el contexto empresarial que necesitan: Glosario y Dominios crean una fuente de significado compartida y gobernada para personas y agentes.
*Gobernar todo su entorno en diferentes nubes y regiones: un único catálogo, un único conjunto de políticas y una gobernanza coherente dondequiera que se ejecuten sus cargas de trabajo.

La era de los agentes ya está aquí. Cientos de miles de agentes actúan ahora sobre los datos empresariales, consultándolos, razonando sobre ellos y tomando decisiones con ellos en tiempo real. Este cambio ha transformado lo que le pedimos al catálogo. El catálogo ha pasado de ser un sistema de registro a convertirse en un tomador de decisiones en tiempo de ejecución para la AI.

Tomar esas decisiones requiere tres cosas: control, para que cada acción, ya sea humana o de un agente, permanezca gobernada; contexto, para que los agentes entiendan el negocio y dejen de tener alucinaciones; y elección, para que nunca dependas de una sola nube, modelo o formato. Juntos, esto es lo que debe significar la gobernanza en la era de los agentes.

Hace cinco años, Databricks fue pionero en la gobernanza de datos y AI al lanzar Unity Catalog, la única solución de gobernanza unificada de la industria para datos y AI en múltiples nubes, formatos y plataformas de datos. Más de 14,000 organizaciones ya gobiernan sus datos y AI en Unity Catalog.

Hoy, estamos impulsando Unity Catalog para cumplir con estos tres pilares: control, contexto y elección. Esto es lo nuevo.

Control: gobernanza de AI para todos tus agentes

Durante años, gobernar un activo significaba gobernar el acceso: quién puede consultar esta tabla, quién puede llamar a este modelo. Pero los agentes no solo acceden a los activos; actúan a través de ellos, llamando a modelos, invocando herramientas y conectándose a servidores MCP. Para responder a este cambio, presentamos un conjunto de capacidades diseñadas para gobernar todo el ciclo de vida del comportamiento de un agente.

Unity AI Gateway: gobierna cada modelo, herramienta y agente

Unity AI Gateway es nuestra solución de gobernanza para la AI empresarial. Basado en Unity Catalog, extiende la gobernanza más allá de los activos de datos y AI a las interacciones en tiempo de ejecución entre modelos, agentes, MCP, habilidades y herramientas:

  • Gobierna cada activo de AI en un solo lugar: Registra y gobierna modelos alojados en Databricks y externos, servicios MCP, agentes y habilidades junto con tus datos, con los mismos controles de acceso, descubrimiento, linaje y auditoría que ya utilizas. Databricks ofrece servicios de modelos fundacionales listos para usar, además de servicios MCP gestionados para aplicaciones como Google Drive, Jira, Slack y GitHub.
  • Controla lo que la AI puede hacer en tiempo de ejecución: Las Políticas de servicio contextuales, ahora en Beta, extienden la gobernanza de quién puede acceder a un modelo o herramienta a lo que este puede hacer en una interacción determinada. Los administradores pueden permitir, denegar o requerir aprobación para acciones como escribir en carpetas confidenciales o enviar código. Las medidas de seguridad integradas protegen contra la exposición de PII, la inyección de prompts y el contenido no seguro.
  • Controla el gasto en AI entre proveedores: Los presupuestos de AI Gateway ahora cubren a proveedores externos, incluidas las conexiones de tipo "trae tu propia clave", para que puedas ver el gasto en AI en modelos alojados en Databricks y externos en un solo lugar. Los límites estrictos de gasto detienen las solicitudes cuando se alcanza un presupuesto, en lugar de simplemente enviar una alerta después de que ocurra.
  • Monitorea e investiga la actividad de la AI: El rastreo unificado de agentes en Unity AI Gateway captura la actividad del modelo y de MCP en una capa de telemetría gobernada, y los rastreos se pueden analizar en Lakewatch, el SIEM nativo de lakehouse de Databricks.
Unity AI Gateway

Lee el anuncio completo sobre gobernanza de AI.

Governance Hub

Governance Hub, ahora en Private Preview, proporciona un centro de comando centralizado para que los administradores y custodios de datos gobiernen su entorno de Databricks: monitorea tu estado, identifica riesgos, prioriza la mitigación y escala las operaciones de gobernanza en datos, AI, costos y rendimiento desde una única experiencia.

Governance Hub

Controles de acceso basados en atributos

Recientemente, anunciamos la disponibilidad general de las políticas ABAC para el filtrado de filas y el enmascaramiento de columnas, junto con las etiquetas gobernadas y la clasificación de datos, para ayudarte a proteger los datos confidenciales a escala.

En el Data + AI Summit, estamos ampliando ABAC con:

  • Políticas de concesión de ABAC (Beta para modelos): Define el acceso basado en atributos una sola vez para otorgar automáticamente permisos EXECUTE en todos los modelos que coincidan, eliminando la sobrecarga por modelo. El soporte futuro se ampliará a otros objetos protegibles, incluidos los componentes de AI (servicios MCP, agentes), tablas y volúmenes.
  • Atributos de identidad (próximamente en Preview): Crea reglas de acceso utilizando propiedades de usuario en tiempo real (por ejemplo, departamento, región, nivel de autorización) sincronizadas desde tu proveedor de identidad o gestionadas en Databricks, yendo más allá del rígido acceso basado en grupos.
  • Atributos de contexto (próximamente en Preview): Aprovecha el contexto de la solicitud, como si el acceso proviene de un agente, una aplicación o un espacio de trabajo, para gestionar de forma segura el acceso intermediado por aplicaciones y agentes.
  • Propagación de etiquetas (Private Preview disponible ahora): Lleva automáticamente las etiquetas gobernadas desde las tablas y columnas de origen a las tablas y vistas descendentes a medida que se transforman los datos, para que tus políticas de clasificación y acceso se mantengan consistentes sin esfuerzo manual.

Controles de acceso basados en roles

El control de acceso basado en roles (próximamente en Public Preview) complementa el modelo colaborativo de identidad y permisos basado en herencia de Databricks al permitir a los clientes definir grupos que se comportan como roles. Un rol es simplemente un grupo con una colección de permisos que los usuarios pueden asumir. Cuando un usuario asume un rol, actúa como ese rol, y todas las acciones, incluido el acceso a los datos, se autorizan con ese rol.

RBAC permite a los clientes modelar nuevos casos de uso, como el acceso exclusivo, donde los roles proporcionan límites de aislamiento de datos para proyectos que trabajan con datos confidenciales donde los conjuntos de datos no deben accederse de forma combinada, por ejemplo, ensayos clínicos o datos específicos de un país, o al realizar tareas con altos privilegios, como la depuración de problemas de control de acceso. Los usuarios pueden cambiar fácilmente de rol en la UI, o especificando un rol en los flujos OAuth del cliente, y el espacio de trabajo se adapta exactamente a lo que permite ese rol.

Contexto: contexto empresarial abierto y adaptativo

Los agentes son tan buenos como el contexto que tienen. Sin una definición compartida de lo que realmente significa el negocio, incluso un agente capaz tendrá que adivinar. Unity Catalog Semantics proporciona a los agentes y a los humanos una única fuente compartida de significado. Los conceptos y los KPI de negocio se definen una sola vez, se organizan por dominio y son accesibles a través de SQL, API y MCP, para que cualquier herramienta o agente pueda utilizarlos sin depender de un proveedor. Ahora estamos ampliando Unity Catalog Semantics con nuevas capacidades para definir y organizar el contexto.

Unity Catalog Semantics para el contexto empresarial

Glosario

Glosario te permite definir conceptos, términos y taxonomías autorizados que ayudan a los agentes y a las personas a comprender tu negocio, o importar los que ya tienes. Las páginas de Glosario se conectan con los datos subyacentes y entre sí, capturando las relaciones. Genie Code redacta borradores de nuevas páginas de Glosario, sugiere mejoras y señala las definiciones que se desvían de cómo se utilizan realmente tus datos, mientras todo tu equipo las cura en conjunto mediante sugerencias, comentarios y propiedad a nivel de dominio. Próximamente estará disponible la Preview de Glosario.

Glosario en Unity Catalog

Dominios

Los dominios, ahora en vista previa pública (Public Preview), organizan sus activos de datos y AI en categorías alineadas con el negocio, lo que proporciona a los agentes un contexto acotado y relevante en lugar de todo el catálogo. Los humanos exploran y los agentes realizan consultas en los dominios a través de un mercado interno, con señales de certificación y administración que muestran qué es confiable. Las sugerencias de dominios impulsadas por AI, que estarán disponibles próximamente en vista previa, le proponen dominios de forma automática para que no tenga que organizarlo todo desde cero.

Dominios: organización de datos y AI alineada con el negocio

Esta base semántica definida por el usuario en Unity Catalog alimenta Genie Ontology, una capa de contexto empresarial de aprendizaje continuo en la plataforma de Databricks. Obtenga más información sobre Genie Ontology en este blog de anuncio.

Métricas

Metrics en Unity Catalog le permiten definir sus KPI de negocio (como ingresos, rotación de clientes, usuarios activos y margen) una sola vez como objetos gobernados y reutilizables, para luego consultarlos de manera consistente desde SQL, herramientas de BI, API y agentes. Estamos ampliando significativamente lo que puede modelar y cómo lo crea:

  • Modelado semántico más enriquecido: Vaya más allá de las medidas de una sola tabla con relaciones multifactoriales (vista previa pública en Dashboards), cálculos de nivel de detalle (LOD) que se computan en la granularidad que elija, métricas parametrizadas que se adaptan a las entradas de tiempo de ejecución y medidas de ventana mejoradas para facilitar el análisis de período a período.
  • Creación agéntica y basada en la UI: Cree y perfeccione modelos de métricas visualmente en la UI, o deje que los agentes redacten y sugieran definiciones por usted, reduciendo la barrera para crear una semántica bien definida.
  • Consultas más rápidas con materialización (vista previa pública): Precompute los resultados de las métricas para que los paneles y las consultas de los agentes se devuelvan más rápido, sin cambiar la forma en que se definen las métricas.
  • Importación desde herramientas de terceros (Beta): Realice un arranque inicial a partir de las herramientas que ya utiliza importando modelos existentes de Power BI y Tableau directamente a Databricks.

Metrics también es abierto: es de código abierto, está disponible en Apache Spark y Unity Catalog OSS, y está listo para Open Semantic Interchange (OSI).

Linaje externo

El linaje externo, ahora disponible de forma general (GA), extiende el linaje en Unity Catalog a activos más allá de Databricks. Puede registrar sistemas de origen ascendentes e informes de BI descendentes para que un único gráfico de linaje abarque todo su flujo de datos de extremo a extremo. Como parte de este lanzamiento, las canalizaciones de ingesta administradas de Lakeflow Connect registran automáticamente el linaje desde las tablas de origen hasta sus tablas de destino en Unity Catalog. Esto proporciona a los agentes una visión más completa de dónde provienen sus datos y cómo se mueven, para que puedan razonar sobre ellos de manera más confiable.

Linaje externo

Información y popularidad de las tablas

Table Insights en Unity Catalog ahora incluye una nueva señal derivada: popularidad a nivel de columna. Desde la página de descripción general de una tabla en Catalog Explorer, puede ver la popularidad relativa de cada columna, medida por la cantidad de consultas históricas que se realizaron en la tabla y que leyeron de ella. Esta señal también alimenta Genie Ontology, lo que le brinda una noción más precisa de qué columnas son más importantes al razonar sobre sus tablas.

Table Insights

Elección: aprovechar la infraestructura abierta para la era agéntica

En la era agéntica, no puede permitirse estar atrapado en un solo proveedor. El cómputo es escaso, los modelos cambian rápidamente y sus datos abarcan múltiples nubes, regiones y formatos. Su infraestructura debe ser flexible para adaptarse a todo ello, de modo que pueda ejecutar sus procesos dondequiera que haya capacidad disponible, mantener los datos en la región correcta, trabajar con distintos formatos y adoptar nuevos modelos a medida que surjan, todo ello sin tener que cambiar de plataforma. Anunciamos varias capacidades nuevas para hacer esto realidad.

Direccionamiento entre nubes y regiones

Unity Catalog ahora amplía la gobernanza a toda la presencia de Databricks de un cliente, abarcando cuentas, regiones y nubes. Un nuevo espacio de nombres de cuatro niveles (metastore.catalog.schema.table) otorga a cada activo una dirección única en todo el entorno, lo que ofrece a los clientes una experiencia de descubrimiento unificada, un conjunto de políticas de acceso aplicadas de manera consistente, un registro de auditoría y linaje a nivel de columna de extremo a extremo.

La gobernanza entre regiones estará disponible próximamente en vista previa. A esto le seguirá la gobernanza entre nubes y entre cuentas. Puede llevar sus cargas de trabajo de Databricks a cualquier nube y región que tenga la capacidad adecuada, GPU o proximidad a sus datos, y la gobernanza se mantendrá consistente en cualquier lugar donde se ejecuten esas cargas de trabajo.

Recuperación ante desastres administrada

La recuperación ante desastres administrada proporciona a los clientes resiliencia para sus cargas de trabajo de misión crítica. Le permite replicar las partes críticas de su implementación de Databricks en una región secundaria y realizar una conmutación por error en ella a los pocos minutos de ocurrir un desastre. La recuperación ante desastres administrada requiere el nuevo complemento Mission Critical, que habilita tanto la recuperación ante desastres administrada como nuestras capacidades existentes de seguridad y cumplimiento mejorados.

Interoperabilidad entre formatos y plataformas

Unity Catalog es el catálogo más completo y abierto en los ecosistemas de Delta Lake y Apache Iceberg, con avances recientes que incluyen Iceberg v3 GA, Managed Iceberg GA, nuevos conectores de federación y ABAC entre motores. En Data + AI Summit, vamos más allá:

  • Acceso externo a tablas Delta administradas (vista previa pública): los motores externos como Spark y Flink ahora pueden crear y escribir en tablas Delta administradas de Unity Catalog.
  • Datos multimodales en formatos abiertos (Beta): un nuevo tipo FILE permite que las tablas administradas de Delta e Iceberg gobiernen de forma nativa datos no estructurados como PDF, imágenes, audio y video.
  • Tipos geoespaciales en Delta e Iceberg v3 (GA): soporte geoespacial nativo para casos de uso como optimización de rutas, análisis de flotas y monitoreo de riesgos geodelimitados.

Ecosistema abierto de colaboración y uso compartido

Hace cinco años, fuimos pioneros en el uso compartido y la colaboración abiertos con el protocolo Delta Sharing; ahora es el protocolo abierto más adoptado para el uso compartido seguro de datos sin copia (zero-copy), utilizado por miles de empresas. Aprovechando este impulso, la semana pasada anunciamos OpenSharing, la próxima evolución de Delta Sharing. OpenSharing, que ahora es un proyecto de la Linux Foundation, presenta el primer protocolo abierto y neutral con respecto al proveedor para compartir de forma segura activos de AI, incluidos Agent Skills, modelos de AI y datos no estructurados.

Ahora anunciamos una serie de capacidades para permitir la colaboración:

  • Uso compartido entre nubes: SecureConnect es una capacidad pionera en su tipo para permitir una conectividad segura entre nubes con un uso compartido de datos sin copia (zero-copy). Global Distribution permite la replicación automatizada entre nubes y regiones.
  • Colaboración multimodal: más allá de los datos, ahora puede colaborar en activos de AI y aplicaciones. Genie Sharing permite la colaboración entre organizaciones en Genie Agents. aplicaciones de terceros también están disponibles ahora en Databricks Marketplace,

Primeros pasos con Unity Catalog

Unity Catalog continúa evolucionando como la única capa de gobernanza unificada de la industria, la base para plataformas de datos seguras, inteligentes y adaptadas al negocio. Ya sea que esté creando agentes de AI, entregando paneles de BI o compartiendo datos entre organizaciones, Unity Catalog lo conecta todo a través de un único catálogo abierto.

Para comenzar, siga las guías de Unity Catalog para AWS, Azure, y GCP.

Regístrese en el Data + AI Summit y explore nuestras sesiones de gobernanza y seguridad.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.