Una forma sencilla y flexible de compartir datos con control de acceso detallado para cualquier destinatario
por Harish Gaur, Tianyi Huang, Darshana Sivakumar, Tia Chang, Mengxi Chen, Jade Wang y Andy Liu
Delta Sharing ha evolucionado a OpenSharing, el primer protocolo abierto y neutral con respecto al proveedor para compartir de forma segura activos de IA, incluidos Agent Skills, modelos de IA y datos no estructurados. Lee el anuncio.
Nos complace anunciar la vista previa pública del uso compartido de vistas multiplataforma. Disponible desde hoy, permite a los proveedores de datos compartir vistas entre diferentes plataformas, nubes y regiones, promoviendo un ecosistema de datos abierto e interoperable.
El uso compartido de vistas ha sido muy útil; otros proveedores también lo ofrecen. Pero, hasta ahora, se limitaba principalmente a la misma plataforma. Se podían compartir vistas dentro de una plataforma, pero no entre múltiples plataformas y nubes. Databricks resuelve este problema con el uso compartido de vistas multiplataforma y le permite compartir vistas sin problemas entre diferentes entornos. Esto marca un antes y un después, ya que amplía el alcance de los proveedores de datos y evita la dependencia de un solo proveedor (vendor lock-in) para los consumidores de datos, lo que hace que la colaboración sea más fácil y rápida.
El uso compartido multiplataforma se alinea con la visión de intercambio abierto de Databricks al permitir un intercambio de datos seguro y sin fricciones entre diferentes plataformas, nubes y regiones
Para entender el uso compartido de vistas, primero comprendamos qué son las vistas. En Databricks, las vistas son representaciones de datos de solo lectura creadas a partir de tablas u otras vistas. Almacenan el texto de la consulta, pero no los datos en sí. Las vistas forman parte de Unity Catalog
El uso compartido de vistas permite a los usuarios compartir vistas mediante el protocolo Delta Sharing. Delta Sharing es el primer protocolo abierto del sector para el intercambio seguro de datos, lo que facilita compartir datos con otras organizaciones, independientemente de las plataformas de datos que utilicen. El uso compartido de vistas fomenta la reutilización y reduce la redundancia, ya que varios usuarios pueden acceder a las mismas vistas y utilizarlas para sus análisis.
Anteriormente, cuando se compartía una vista entre cuentas de Databricks, los consumidores solo podían consultarla mediante Databricks Serverless SQL. Databricks Serverless SQL funciona en los tres principales proveedores de nube: AWS, Azure y Google Cloud Platform (GCP), por lo que las vistas se podían compartir entre nubes.
Ahora, con el uso compartido de vistas multiplataforma, los consumidores de datos pueden aprovechar cualquier tipo de clúster de Databricks o incluso utilizar clientes abiertos de Delta Sharing para acceder a las vistas compartidas y consultarlas. Los clientes abiertos de Delta Sharing son herramientas o plataformas compatibles con el protocolo Delta Sharing, lo que permite a los usuarios acceder a las vistas compartidas sin necesidad de utilizar Databricks. Estos clientes incluyen sistemas populares como Apache Spark™, Pandas, Power BI, Tableau y otros. Esto hace posible que los usuarios de otras plataformas (es decir, que no utilizan Databricks) puedan seguir accediendo a las vistas compartidas y consultándolas a través de Delta Sharing.
Echemos un vistazo a esta demostración para ver el uso compartido de vistas multiplataforma en acción
En este escenario, dos clientes de Databricks pueden compartir vistas sin problemas dentro del ecosistema de Databricks. ¿Por qué es esto importante? Las organizaciones colaboran con socios que pueden estar en diferentes nubes y regiones, y desean compartir vistas con clientes o socios en distintas nubes y regiones. Al aprovechar la tecnología de Delta Sharing, pueden compartir vistas de forma segura y sin problemas, sin tener que realizar copias duplicadas de los datos.
En este escenario, los clientes de Databricks pueden compartir vistas con destinatarios externos que no utilizan Databricks. El uso compartido de vistas multiplataforma admite conectores abiertos (como Apache Spark™, Pandas, Power BI, Tableau, etc.), lo que permite a los destinatarios acceder a las vistas compartidas a través del protocolo Delta Sharing. Esta capacidad es especialmente beneficiosa para los analistas de negocios y los usuarios de líneas de negocio que requieren un acceso simplificado a los datos sin necesidad de interactuar directamente con plataformas de datos complejas.
Los proveedores de datos de Databricks Marketplace se benefician del uso compartido de vistas multiplataforma al ampliar significativamente su alcance en el mercado y sus oportunidades de monetización. Esta capacidad les permite compartir vistas con una audiencia más amplia, incluidos clientes que no utilizan Databricks, lo que aumenta su base de clientes potenciales. Los consumidores de datos no se limitan a consultar vistas desde la plataforma de Databricks, lo que evita la dependencia de Databricks.
El uso compartido de vistas multiplataforma marca un antes y un después para nuestros clientes. Llevar el intercambio de datos sin copia a empresas complejas a gran escala requiere flexibilidad. La capacidad de compartir vistas entre plataformas nos permite ofrecer las ventajas de seguridad y rendimiento de Delta Sharing a más clientes, ayudándoles a obtener valor de sus datos de clientes de forma más rápida.— Derek Slager, CTO y cofundador de Amperity
En los próximos meses, los lectores pueden esperar que Databricks introduzca varias funciones avanzadas de intercambio de datos. Entre las próximas funciones se incluye Sharing for Lakehouse Federation, que permite a los proveedores de datos compartir datos directamente desde varias plataformas (por ejemplo, Amazon Redshift, Azure Synapse, Google BigQuery, Snowflake) sin necesidad de replicación.
Además, el soporte de OAuth para D2O mejorará la seguridad al permitir que los destinatarios se autentiquen mediante tokens de OAuth de sus proveedores de identidad (IdP) de confianza. Asimismo, el uso compartido de vistas materializadas y Delta Live Tables permitirá una distribución eficiente de los resultados de consultas precalculados y datos en streaming, ofreciendo datos actualizados con un mejor rendimiento y menores costos.
El uso compartido de vistas multiplataforma está disponible hoy en vista previa pública para los clientes de AWS, GCP y Azure. Descubra cómo puede utilizar el protocolo de intercambio abierto Delta Sharing para compartir datos desde su espacio de trabajo de Databricks habilitado para Unity Catalog con cualquier usuario en cualquier plataforma informática y en cualquier lugar
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.