En Databricks, nuestro objetivo es hacer que los datos y la IA sean accesibles para todos, no solo dentro de una única organización, sino también más allá de los límites organizacionales. Tres componentes de la plataforma de Databricks son fundamentales para hacer posible el uso compartido y la colaboración. En primer lugar, nuestro protocolo abierto Delta Sharing permite a los clientes compartir de forma segura datos y activos de IA entre nubes y plataformas, lo que elimina los silos e impulsa la innovación. En segundo lugar, el Databricks Marketplace funciona como una plataforma abierta para todas sus necesidades de datos e IA, con socios líderes que proporcionan datos y activos de IA de forma nativa en Databricks. Por último, las Databricks Clean Rooms permiten la colaboración centrada en la privacidad para empresas en cualquier plataforma en la nube.
En el Data + AI Summit 2025, estamos avanzando en la forma en que las organizaciones comparten y colaboran con datos e IA. Con nuevas funciones y un ecosistema de socios ampliado, facilitamos el intercambio seguro de activos y el trabajo entre plataformas. Estas son las novedades y por qué son importantes en Delta Sharing, Clean Rooms y Marketplace.
Delta Sharing permite el intercambio de datos seguro y multiplataforma sin importar la nube, la plataforma o la región. Estamos ampliando las capacidades para compartir datos con nuevas funciones que admiten casos de uso más amplios y reducen la complejidad del intercambio de datos entre diferentes ecosistemas.
Hoy en día, las organizaciones suelen trabajar con múltiples formatos de tabla, los más comunes son Delta Lake y Apache Iceberg. Databricks ofrece el soporte más completo e integral para el uso compartido de datos, independientemente del formato que utilice.
Con Delta Sharing, ahora obtienes interoperabilidad total con Iceberg:
Estas características hacen de Delta Sharing el protocolo abierto de mayor alcance para el intercambio de datos, lo que elimina la necesidad de duplicar datos o convertir archivos. Si le interesa probar esta función, inscríbase para la Private Preview aquí.
Los proveedores de datos quieren mantener una única copia de sus datos en un formato abierto, pero también quieren que los clientes externos puedan acceder a ellos fácilmente en vivo, directamente desde la fuente. Este enfoque a menudo generaba complejidad relacionada con las reglas del firewall y la configuración de la red. El nuevo Delta Sharing Network Gateway elimina esa carga. Ahora los proveedores de datos pueden compartir con los destinatarios con una configuración de red manual mínima. Es compatible con el almacenamiento gestionado por el cliente (p. ej., ADLS y S3), así como con el almacenamiento predeterminado de Databricks. Si le interesa probar esta función, inscríbase en la versión preliminar privada.
El uso compartido de tablas de streaming y vistas materializadas (MV/ST), que antes estaba en versión preliminar pública, estará disponible de forma general en las próximas semanas. Esto permite a los proveedores de datos crear y compartir de forma eficiente vistas de los datos orientadas al cliente utilizando vistas materializadas y tablas de streaming.
La compatibilidad con ABAC (control de acceso basado en atributos) de Delta Sharing permite a los proveedores aplicar de forma segura políticas de acceso a los datos detalladas al compartir datos, lo que garantiza que la información confidencial esté protegida y, a la vez, permite una amplia colaboración de datos. El destinatario también puede usar ABAC en las tablas recibidas, lo que le permite controlar el acceso a los datos externos dentro de su propia organización. La versión beta de esta característica estará disponible en los próximos meses.
Nos complace presentar la disponibilidad general de OIDC Token Federation for Enhanced Delta Sharing Security. Los proveedores de datos pueden compartir datos de forma segura con usuarios que no son de Databricks en cualquier plataforma de computación que prefieran autenticarse usando un proveedor de identidad (IdP) personalizado, como Azure Entra ID u Okta.
Impulsados por Delta Sharing, los Databricks Clean Rooms permiten a las empresas colaborar de forma segura con socios y clientes, sin exponer los datos sin procesar. En el DAIS 2025, presentamos tres actualizaciones importantes:
Resolución de identidades centrada en la privacidad: Al unir activos de datos dispares, los clientes a menudo necesitan convertir datos de PII en un identificador compartido común para garantizar que las entidades relacionadas en todos los conjuntos de datos puedan vincularse, incluso sin coincidencias exactas. Al permitir que la resolución de identidades se produzca in situ dentro de Databricks Clean Rooms, las organizaciones pueden colaborar de forma segura sin necesidad de exponer datos personales sin procesar a proveedores de identidad de terceros.
Ya disponible en Google Cloud (GA): Los clientes ya pueden implementar Clean Rooms en GCP, lo que permite una colaboración segura con los socios en AWS, Azure y otras plataformas. Esto respalda nuestro enfoque de colaboración “en cualquier nube, en cualquier plataforma”, sin necesidad de mover los datos.
Colaboración multipartita: Clean Rooms ahora admite varios colaboradores en una única sala. Anteriormente, cada Clean Room era, en la práctica, solo para dos partes; ahora puede invitar hasta a 9 organizaciones más (es decir, 10 en total). Estos colaboradores pueden estar en diferentes nubes, regiones o plataformas de datos y aun así trabajar juntos en un entorno central. Esto posibilita “Cualquier escala, cualquier nivel de confianza” y admite colaboraciones de muchos a muchos con controles de acceso detallados y orquestación.
Ejecute sus propios Notebooks: Clean Rooms ahora admite ejecuciones propias seguras, lo que permite a los colaboradores cargar y ejecutar sus propios notebooks por primera vez, solo con la aprobación explícita de otros participantes de la Clean Room. Anteriormente, los notebooks solo podían ser ejecutados por la otra parte, con la aprobación implícita al hacer clic en el botón de ejecución.
Lea este blog para obtener más información y demostraciones detalladas.
Databricks está ampliando el alcance de su ecosistema abierto al dar la bienvenida a socios para que creen soluciones de uso compartido de datos, ampliando las asociaciones existentes basadas en la plataforma para nuevas capacidades y promoviendo asociaciones tecnológicas que ayudan a los clientes conjuntos a compartir sin problemas entre plataformas.
En el Data and AI Summit 2025, nos enorgullece destacar a varios socios nuevos que se unen al ecosistema en crecimiento:
En Databricks, mantenemos nuestro compromiso de establecer el estándar para la colaboración de datos abierta , permitiendo a las organizaciones compartir cualquier activo con cualquier persona en cualquier plataforma. A medida que continuamos innovando con Delta Sharing, Clean Rooms y Databricks Marketplace, nuestro objetivo es que colaborar con los datos de forma segura y a escala sea más fácil que nunca.
Estamos muy contentos de que explore estas nuevas características y cómo pueden transformar la forma en que su organización colabora con los datos.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Produto
June 12, 2024/11 min de leitura

