Hoy, nos complace anunciar que Lakehouse Federation en Unity Catalog ya está disponible Generalmente (GA) en AWS, Azure y GCP. Lakehouse Federation te permite descubrir, consultar y gobernar todos tus datos en un solo lugar. Con este lanzamiento GA, puedes esperar mayor estabilidad, seguridad y preparación empresarial para tus cargas de trabajo federadas.
En esta publicación de blog, repasamos las capacidades GA de Lakehouse Federation, exploramos cómo está impulsando análisis ágiles en las empresas líderes del mundo y discutimos los próximos pasos.
Las organizaciones de todo el mundo, independientemente de su tamaño o industria, están aprovechando los datos y la IA para impulsar la innovación. Sin embargo, debido a razones históricas, organizacionales o tecnológicas, los datos a menudo permanecen dispersos en múltiples sistemas operativos y analíticos. Esta fragmentación genera varios desafíos:
Lakehouse Federation aborda estos puntos débiles críticos y facilita que las organizaciones expongan, consulten y gobiernen sistemas de datos aislados como una extensión de su lakehouse. Con estas nuevas capacidades, puedes:
Más de 5,000 clientes de Databricks están aprovechando Lakehouse Federation para unificar sus patrimonios de datos, garantizando un descubrimiento y gobernanza de datos consistentes.

"Lakehouse Federation nos ha permitido combinar todos nuestros activos de datos en múltiples almacenes de datos y bases de datos bajo Unity Catalog, simplificando el descubrimiento de datos y la gestión de acceso. Esto desbloquea una variedad de casos de uso, incluida la ingesta y las consultas ad hoc, lo que hace que nuestros análisis sean más fáciles que nunca." — Alexander Booth, Director Asistente de Investigación de los Texas Rangers
Nos complace anunciar la Disponibilidad General para los conectores de MySQL, PostgreSQL, Amazon Redshift, Snowflake, Azure SQL Database, SQL Server y Azure Synapse.
Este lanzamiento marca un hito importante en varias áreas:
"Lakehouse Federation nos ha ayudado a consolidar nuestro panorama de datos con gobernanza consistente en un solo lugar y a generar importantes ganancias de eficiencia operativa. Los insights y la calidad de los datos ahora están integrados sin problemas, lo que nos permite enfocarnos en brindar a nuestros clientes los mejores insights para maximizar el valor de sus inversiones en publicidad." — Bob Wuisman, Director Global de Producción de Ebiquity plc.
Descubre, gobierna y accede a datos de Hive Metastore (HMS) y AWS Glue con Lakehouse Federation. Con Catalog Federation, podrás montar fácilmente cualquier HMS externo (o interno de Databricks) como un catálogo externo en Unity Catalog.
Para los usuarios de Databricks HMS (interno), esta es una forma sencilla y directa de comenzar con Unity Catalog y beneficiarse de las capacidades de gobernanza unificada que proporciona Unity Catalog.
Para los usuarios de HMS y AWS Glue externos, proporciona una forma estrechamente integrada de acceder a datos de metadatos externos directamente desde Unity Catalog sin cambiar tus flujos de trabajo.
Catalog Federation está actualmente en Private Preview.
Ampliar la lista de orígenes de datos compatibles para Lakehouse Federation sigue siendo una prioridad principal en nuestra misión de ayudar a los clientes a unificar sus patrimonios de datos. Nos complace anunciar que los conectores de Google BigQuery, que completan el soporte de federación de almacenes de datos en los tres principales proveedores de nube, y Salesforce Data Cloud ahora están en Public Preview.
Los conectores de Oracle y Teradata estarán disponibles pronto en vista previa.
Para ofrecer una experiencia de consulta más rápida en almacenes de datos, que tienden a contener tablas más grandes, estamos añadiendo capacidades para realizar transferencias de datos automáticas de alto rendimiento.
En el futuro, comenzando con los conectores de Amazon Redshift & Snowflake, podrás consultar y materializar tablas de almacenes de datos rápidamente. Detrás de escena, Lakehouse Federation aprovechará las API más rápidas/masivas (por ejemplo, descarga a almacenamiento de objetos o ubicación provisional en paralelo) y obtendrá estos resultados en paralelo (sin cuellos de botella del controlador). ¡Todo sin ninguna intervención del usuario!

Finalmente, compartir datos de Lakehouse Federation será mucho más fácil. La próxima integración de Delta Sharing permitirá a los clientes compartir tablas federadas externamente sin que los destinatarios necesiten acceso a Databricks o al sistema de datos subyacente. Esto agilizará el intercambio de datos al eliminar la necesidad de copias redundantes en diferentes sistemas.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
