• Unity Catalog unifica Delta Lake y Apache Iceberg™, eliminando silos de formatos para proporcionar gobernanza e interoperabilidad sin interrupciones entre nubes y motores.
• Databricks está extendiendo Unity Catalog a los trabajadores del conocimiento al convertir las métricas de negocio en activos de datos de primera clase con Unity Catalog Metrics e introduciendo un mercado interno curado que ayuda a los equipos a descubrir fácilmente activos de datos e IA de alto valor organizados por dominio.
• Los controles de gobernanza mejorados, como el control de acceso basado en atributos y la monitorización de la calidad de los datos, escalan la gestión segura de datos en toda la empresa.
Hace cuatro años, Databricks observó una complejidad tremenda en el panorama de los datos: catálogos separados para cada plataforma, herramientas de gobernanza aisladas entre nubes y ninguna forma unificada de proteger los activos de IA. Fuimos pioneros en Gobernanza Unificada al lanzar Unity Catalog, una capa de catálogo abierta y flexible para gestionar el acceso, linaje, auditoría y descubrimiento en todos los datos y activos de IA.
Hoy, Unity Catalog se ha convertido en la base de la Plataforma de Inteligencia de Datos de Databricks y la única solución de gobernanza unificada de la industria para datos e IA en todos los formatos, nubes y motores. Desde el intercambio abierto de datos hasta la seguridad granular y la gobernanza del conocimiento, Unity Catalog ayuda a las organizaciones a aportar contexto, control y confianza a su patrimonio de datos.
En el Data + AI Summit de este año, anunciamos innovaciones importantes en Unity Catalog, ofreciendo el mejor catálogo para Apache Iceberg™, nuevas experiencias para usuarios de negocio y gobernanza inteligente para proteger datos sensibles y garantizar una calidad de datos confiable a escala.
Esto es lo nuevo.
Las organizaciones que adoptan un lakehouse a menudo se ven obligadas a elegir entre Delta Lake y Apache Iceberg™. Esa elección crea silos artificiales: restringe el acceso a las herramientas de datos e IA que los equipos pueden usar, fragmenta la gobernanza y bloquea los metadatos en catálogos específicos del formato.
Unity Catalog elimina la necesidad de elegir. Basado en estándares abiertos, Unity Catalog es el único catálogo unificado que funciona sin problemas en todos los formatos, motores y nubes, lo que lo convierte en la base del lakehouse abierto. Durante el último año, tras la adquisición de Tabular, hemos invertido profundamente en Apache Iceberg para extender esta visión. Nos complace anunciar:
En conjunto, estas capacidades rompen los silos de formato y posicionan a Unity Catalog como el único catálogo que ofrece una gobernanza e interoperabilidad verdaderamente abiertas y unificadas. Consulte nuestro blog sobre el soporte de Iceberg para obtener más información sobre estos anuncios.

Las plataformas de datos no deberían limitarse al usuario técnico. Los usuarios de negocio necesitan una forma clara y coherente de encontrar, confiar y trabajar con los datos. Unity Catalog ahora ofrece una base unificada para el contexto de negocio que cierra la brecha entre los equipos de datos y los de negocio.
Las definiciones inconsistentes de métricas en herramientas y equipos han causado durante mucho tiempo confusión, desalineación y falta de confianza en los datos. Unity Catalog Metrics, ahora en Vista Previa Pública en AWS, Azure, y GCP y que estará Disponible Generalmente a finales de este verano, resuelve esto al convertir las métricas de negocio en activos de primera clase en el lakehouse. A diferencia de las métricas definidas solo en la capa de BI, que limitan la reutilización y la integración, definir métricas en la capa de datos hace que la semántica de negocio sea reutilizable en todas las cargas de trabajo, como paneles, modelos de IA y trabajos de ingeniería de datos. Las Métricas de Unity Catalog también son totalmente accesibles a través de SQL para garantizar que todos en la organización puedan tener la misma visión de las métricas, independientemente de la herramienta que elijan.

"Unity Catalog Metrics nos brinda un lugar central para definir KPIs de negocio y estandarizar la semántica entre equipos, asegurando que todos trabajen con las mismas definiciones confiables en paneles, SQL y aplicaciones de IA." — Richard Masters, Vicepresidente, Datos e IA, Virgin Atlantic
"Unity Catalog Metrics representa una oportunidad emocionante para los clientes de Tableau de aprovechar el valor de la gobernanza centralizada con Databricks Unity Catalog. A través de nuestra profunda integración y hoja de ruta en expansión con Databricks, estamos encantados de ayudar a eliminar las fricciones para nuestros clientes al utilizar Databricks para definir sus métricas de negocio principales." — Nicolas Brisoux, Director Principal de Gestión de Producto, Tableau
Para empoderar completamente a los usuarios de negocio, debes hacer que los datos confiables sean fáciles de encontrar, entender y usar. Unity Catalog está ampliando su gobernanza consciente del negocio con una nueva experiencia de Descubrimiento, ahora en Vista Previa Privada, un mercado interno curado de productos de datos certificados organizados por dominios de negocio como Ventas, Marketing o Finanzas.
Las recomendaciones impulsadas por IA y la curación de administradores de datos ayudan a mostrar los activos de mayor valor, como métricas, paneles, tablas, agentes de IA y espacios Genie que están enriquecidos con documentación, propiedad e información de uso. Las nuevas señales inteligentes resaltan la calidad de los datos, los patrones de uso, las relaciones y el estado de certificación, ayudando a los usuarios a evaluar rápidamente la confianza y la relevancia. Además, con Databricks Assistant integrado, los usuarios pueden hacer preguntas en lenguaje natural y obtener respuestas claras y contextuales basadas en métricas gobernadas.

También estamos introduciendo nuevas capacidades inteligentes en Databricks para hacer que el descubrimiento de datos sea más fácil e intuitivo, dondequiera que los usuarios trabajen en la plataforma. Impulsadas por Unity Catalog, estas características ayudan a los equipos a encontrar datos confiables más rápido y a comprender su contexto de un vistazo.
Escalar la gobernanza de datos se vuelve cada vez más desafiante a medida que las organizaciones crecen, con más usuarios, equipos y activos de datos para administrar. Las políticas estáticas y los controles manuales no pueden seguir el ritmo, lo que genera brechas de gobernanza, riesgos de seguridad y cuellos de botella operativos.
Para abordar estos desafíos, Unity Catalog ahora proporciona automatización inteligente y controles flexibles y escalables para clasificar datos sensibles, aplicar políticas de manera consistente y acelerar el acceso seguro a los datos en todo el lakehouse.
Control de acceso basado en atributos (ABAC): Define políticas de acceso flexibles utilizando etiquetas que se pueden aplicar en el nivel de catálogo, esquema o tabla. ABAC está disponible en Beta para seguridad a nivel de fila y columna en AWS, Azure, y GCP.
Políticas de etiquetas: Las políticas de etiquetas aplican una capa de gobernanza sobre cómo se crean, asignan y utilizan las etiquetas en Databricks. Estas políticas a nivel de cuenta garantizan que las etiquetas sigan siendo consistentes y confiables, admitiendo todo, desde la clasificación de datos hasta la atribución de costos. Las políticas de etiquetas están disponibles en Beta en AWS, Azure, y GCP.
Clasificación de datos: Detecta y etiqueta inteligentemente datos sensibles en Unity Catalog. Los datos nuevos se escanean dentro de las 24 horas para detectar automáticamente nueva PII, minimizando el esfuerzo manual y permitiendo a los equipos mantenerse al tanto del acceso a los datos. Cuando se utiliza con ABAC, la clasificación de datos protege automáticamente los datos sensibles según sus políticas de control de acceso. La clasificación de datos está disponible en Beta en AWS, Azure, y GCP.
“Implementar el enmascaramiento de columnas en más de 5.000 tablas solía ser un esfuerzo manual enorme. Con ABAC, podemos aplicar políticas consistentes de forma dinámica, mejorando drásticamente tanto la velocidad como la gobernanza.” — Ramesh Balasubramanyan, Administrador de Databricks, SAIF
“Databricks Data Classification ha sido un punto de inflexión en nuestra estrategia de privacidad y seguridad de datos. Combinado con ABAC, nos permite proteger automáticamente los datos sensibles sin restringir los datos que nuestros analistas necesitan. El mayor beneficio ha sido la velocidad, ya que la clasificación y el enmascaramiento automatizados reducen significativamente la carga de trabajo manual, liberando nuestros recursos y ahorrando a nuestro equipo incontables horas cada semana.” — Mary Tesfay, Directora de Datos y Analítica, Corp IT, Navitas
Unity Catalog ahora detecta de forma inteligente y ayuda a resolver problemas de calidad de datos en todas sus tablas con la supervisión de la calidad de los datos, disponible en beta en AWS, Azure, y GCP. La supervisión de la calidad de los datos comprueba la frescura —la frecuencia con la que se han actualizado los datos— y la completitud —si los volúmenes de datos son los esperados— utilizando inteligencia de datos en esquemas completos. Los consumidores pueden comprender el estado de los datos de un vistazo con indicadores de estado, mientras que los propietarios de los datos pueden comprender la prioridad de los problemas basándose en el linaje descendente, descubrir la causa raíz y establecer alertas utilizando registros y paneles integrados.

Unity Catalog continúa evolucionando como la única capa de gobernanza unificada de la industria, la base para plataformas de datos seguras, inteligentes y conscientes del negocio. Ya sea que esté creando agentes de IA, entregando paneles de BI o compartiendo datos entre organizaciones, Unity Catalog lo conecta todo a través de un catálogo único y abierto.
Para empezar, siga las guías de Unity Catalog para AWS, Azure, y GCP.
Vea la presentación principal de Data + AI Summit 2025 de Matei Zaharia, Cofundador y Director de Tecnología de Databricks, para obtener más información sobre estos anuncios recientes.
Regístrese para Data + AI Summit y explore la pista de gobernanza de datos e IA
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
