Unity AI Gateway, Glossário, endereçabilidade entre nuvens e entre regiões, Hub de Governança e muito mais
O que há de novo no Unity Catalog, em resumo:
*Governe o que os agentes de AI fazem, não apenas o que eles acessam: o Unity AI Gateway traz modelos, agentes, ferramentas e MCPs sob uma única camada de governança de runtime.
*Dê aos agentes o contexto de negócios de que precisam: Glossário e Domínios criam uma fonte de significado compartilhada e governada para pessoas e agentes.
*Governe todo o seu ambiente em nuvens e regiões: um único catálogo, um único conjunto de políticas e governança consistente onde quer que suas cargas de trabalho sejam executadas.
A era dos agentes chegou. Centenas de milhares de agentes estão agora atuando sobre dados corporativos, consultando-os, raciocinando sobre eles e tomando decisões em tempo real. Essa mudança alterou o que exigimos do catálogo. O catálogo passou de um sistema de registro para um tomador de decisões em tempo de execução para AI.
Tomar essas decisões exige três coisas: controle, para que cada ação, humana ou de agente, permaneça governada; contexto, para que os agentes entendam o negócio e parem de alucinar; e escolha, para que você nunca fique preso a uma única nuvem, modelo ou formato. Juntos, isso é o que a governança deve significar na era dos agentes.
Há cinco anos, a Databricks foi pioneira na governança de dados e AI ao lançar o Unity Catalog, a única solução de governança unificada do setor para dados e AI em diferentes nuvens, formatos e plataformas de dados. Mais de 14.000 organizações agora governam seus dados e AI no Unity Catalog.
Hoje, estamos avançando o Unity Catalog para entregar todos os três: controle, contexto e escolha. Aqui está o que há de novo.
Durante anos, governar um ativo significava governar o acesso: quem pode consultar esta tabela, quem pode chamar este modelo. Mas os agentes não apenas acessam ativos; eles agem por meio deles, chamando modelos, invocando ferramentas e conectando-se a servidores MCP. Para acompanhar essa mudança, estamos apresentando um conjunto de recursos criados para governar todo o ciclo de vida do comportamento de um agente.
Unity AI Gateway é a nossa solução de governança para AI corporativa. Desenvolvido sobre o Unity Catalog, ele estende a governança além dos ativos de dados e AI para as interações em tempo de execução entre modelos, agentes, MCPs, habilidades e ferramentas:

Leia o anúncio completo de governança de AI.
O Governance Hub, agora em PrPr, oferece um centro de comando centralizado para administradores e curadores de dados governarem seu ambiente Databricks: monitore sua postura, identifique riscos, priorize correções e dimensione as operações de governança em dados, AI, custos e desempenho a partir de uma única experiência.

Recentemente, anunciamos a Disponibilidade Geral (GA) das políticas de ABAC para filtragem de linhas e mascaramento de colunas, junto com as Tags Governadas e Classificação de Dados, para ajudar você a proteger dados confidenciais em escala.
No Data + AI Summit, estamos estendendo o ABAC com:
O controle de acesso baseado em funções (Public Preview em breve) complementa o modelo colaborativo de identidade e permissão baseado em herança do Databricks, permitindo que os clientes definam grupos que se comportam como funções. Uma função é apenas um grupo com uma coleção de permissões que os usuários podem assumir. Quando um usuário assume uma função, ele age como essa função, e todas as ações, incluindo o acesso a dados, são autorizadas como essa função.
O RBAC permite que os clientes modelem novos casos de uso, como acesso exclusivo, onde as funções fornecem limites de isolamento de dados para projetos que trabalham com dados confidenciais nos quais os conjuntos de dados não devem ser acessados em combinação, por exemplo, ensaios clínicos ou dados específicos de um país, ou ao realizar tarefas altamente privilegiadas, como depurar problemas de controle de acesso. Os usuários podem alternar facilmente entre funções na UI ou especificando uma função nos fluxos OAuth do cliente, e o espaço de trabalho se adapta exatamente ao que essa função permite.
Os agentes são tão bons quanto o contexto que possuem. Sem uma definição compartilhada do que o negócio realmente significa, até mesmo um agente capaz irá adivinhar. Unity Catalog Semantics fornece a agentes e humanos uma fonte única e compartilhada de significado. Conceitos e KPIs de negócios são definidos uma vez, organizados por domínio e acessíveis via SQL, APIs e MCPs, para que qualquer ferramenta ou agente possa usá-los sem aprisionamento tecnológico. Agora estamos estendendo o Unity Catalog Semantics com novos recursos para definir e organizar o contexto.

O Glossário permite definir conceitos, termos e taxonomias autoritativos que ajudam agentes e pessoas a entender o seu negócio, ou importar os que você já possui. As páginas do Glossário se conectam aos dados subjacentes e entre si, capturando relacionamentos. O Genie Code cria rascunhos de novas páginas do Glossário, sugere refinamentos e sinaliza definições que se desviam de como seus dados são realmente usados, enquanto toda a sua equipe os cura em conjunto por meio de sugestões, comentários e propriedade em nível de domínio. A pré-visualização do Glossário estará disponível em breve.

Os Domínios, agora em Public Preview, organizam seus ativos de dados e IA em categorias alinhadas aos negócios, fornecendo aos agentes um contexto delimitado e relevante em vez de todo o catálogo. Pessoas navegam e agentes consultam domínios por meio de um marketplace interno, com sinais de certificação e curadoria mostrando o que é confiável. Sugestões de domínios orientadas por IA, que estarão disponíveis em breve em preview, propõem domínios para você de forma automática, para que você não precise organizar tudo do zero.

Essa base semântica definida pelo usuário no Unity Catalog alimenta a Genie Ontology, uma camada de contexto empresarial de aprendizado contínuo na Databricks Platform. Saiba mais sobre a Genie Ontology neste blog de anúncio.
As Métricas no Unity Catalog permitem que você defina seus KPIs de negócios, como receita, churn, usuários ativos e margem, uma única vez como objetos governados e reutilizáveis, e depois os consulte de forma consistente a partir de SQL, ferramentas de BI, APIs e agentes. Estamos expandindo significativamente o que você pode modelar e como pode criá-lo:
O Metrics também é aberto: é de código aberto (open source), está disponível no Apache Spark e no Unity Catalog OSS, e está pronto para o Open Semantic Interchange (OSI).
A Linhagem externa, agora em disponibilidade geral (GA), estende a Linhagem no Unity Catalog para ativos além do Databricks. Você pode registrar sistemas de origem upstream e relatórios de BI downstream para que um único gráfico de linhagem abranja todo o seu fluxo de dados de ponta a ponta. Como parte deste lançamento, os pipelines de ingestão gerenciados do Lakeflow Connect registram a linhagem automaticamente das tabelas de origem para suas tabelas de destino no Unity Catalog. Isso dá aos agentes uma visão mais completa de onde vêm seus dados e como eles se movem, para que possam raciocinar sobre eles com mais confiabilidade.

O Table Insights no Unity Catalog agora inclui um novo sinal derivado: Popularidade ao nível da coluna. Na página de visão geral de uma tabela no Catalog Explorer, você pode ver a popularidade relativa de cada coluna, medida por quantas consultas históricas contra a tabela leram a partir dela. Esse sinal também alimenta a Genie Ontology, dando a ela uma percepção mais precisa de quais colunas são mais importantes ao raciocinar sobre suas tabelas.

Na era agêntica, você não pode se dar ao luxo de ficar preso a um único fornecedor. A computação é escassa, os modelos mudam rapidamente e seus dados abrangem várias nuvens, regiões e formatos. Sua infraestrutura precisa ser flexível para abranger tudo isso, permitindo que você execute onde quer que haja capacidade, mantenha os dados na região correta, trabalhe com diferentes formatos e adote novos modelos à medida que surgirem, tudo sem precisar mudar de plataforma. Estamos anunciando vários novos recursos para tornar isso realidade.
O Unity Catalog agora está estendendo a governança por toda a presença do Databricks do cliente, abrangendo contas, regiões e nuvens. Um novo namespace de quatro níveis (metastore.catalog.schema.table) dá a cada ativo um único endereço em todo o ecossistema, proporcionando aos clientes uma experiência de descoberta unificada, um conjunto de políticas de acesso aplicadas de forma consistente, uma trilha de auditoria e linhagem ao nível de coluna de ponta a ponta.
A governança entre regiões estará disponível em breve em preview. A governança entre nuvens e entre contas virá em seguida. Você pode levar suas cargas de trabalho do Databricks para qualquer nuvem e região que tenha a capacidade adequada, GPUs ou proximidade com seus dados, e a governança permanece consistente em todos os lugares onde essas cargas de trabalho são executadas.
A recuperação de desastres gerenciada oferece resiliência aos clientes para suas cargas de trabalho de missão crítica. Ela permite replicar as partes críticas da sua implantação do Databricks para uma região secundária e fazer o failover para ela em poucos minutos após um desastre. A Recuperação de Desastres Gerenciada requer o novo add-on Mission Critical, que desbloqueia tanto a Recuperação de Desastres Gerenciada quanto nossos recursos existentes de Segurança e Conformidade Avançadas.
O Unity Catalog é o catálogo mais abrangente e aberto nos ecossistemas Delta Lake e Apache Iceberg, com avanços recentes que incluem Iceberg v3 GA, Managed Iceberg GA, novos conectores de federação e ABAC entre mecanismos. No Data + AI Summit, estamos indo além:
Há cinco anos, fomos pioneiros no compartilhamento e colaboração abertos com o protocolo Delta Sharing — ele é agora o protocolo aberto mais amplamente adotado para compartilhamento seguro de dados sem cópia (zero-copy), usado por milhares de empresas. Aproveitando esse impulso, na semana passada anunciamos o OpenSharing, a próxima evolução do Delta Sharing. O OpenSharing, agora um projeto da Linux Foundation, apresenta o primeiro protocolo aberto e neutro em relação a fornecedores para compartilhar com segurança ativos de IA, incluindo Agent Skills, modelos de IA e dados não estruturados.
Estamos anunciando agora uma série de recursos para viabilizar a colaboração:
O Unity Catalog continua evoluindo como a única camada de governança unificada do setor, a base para plataformas de dados seguras, inteligentes e alinhadas aos negócios. Quer você esteja criando agentes de AI, entregando dashboards de BI ou compartilhando dados entre organizações, o Unity Catalog conecta tudo por meio de um único catálogo aberto.
Para começar, siga os guias do Unity Catalog para AWS, Azure e GCP.
Inscreva-se no Data + AI Summit e explore nossas Sessões de Governança e Segurança.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.