Las aplicaciones de Databricks Marketplace y Packaged Clean Rooms permiten a los proveedores de datos distribuir IP como aplicaciones instalables, manteniendo los datos de las marcas donde pertenecen.
por Sridhar Sundaresan y Suvan Kaul
Las marcas invierten mucho en la creación de activos de datos de origen, incluidos historiales de compras, registros de CRM, programas de fidelización e interacciones en el sitio web. Esos datos están fragmentados en distintos sistemas y son difíciles de activar en todos los canales. Sin embargo, los datos de origen por sí solos solo cuentan una parte de la historia.
Para crear perfiles de audiencia completos, las marcas necesitan cotejar sus registros con las columnas vertebrales de los proveedores de identidad para obtener gráficos de identidad multicanal que abarquen correos electrónicos, IDs de dispositivos, cookies y puntos de contacto sin conexión.
El enfoque tradicional es complejo. Las marcas exportan los registros de los clientes a una plataforma de terceros, el proveedor de identidad ejecuta sus algoritmos de coincidencia y los resultados llegan días después. Cada paso introduce riesgos: los datos salen del entorno seguro de la marca, la PII viaja a través de las redes y los equipos de cumplimiento normativo deben revisar los acuerdos de intercambio de datos, cuya negociación puede llevar semanas.
Al mismo tiempo, las normativas de privacidad y las restricciones de las plataformas han hecho que:
Esto genera una brecha fundamental: las marcas tienen datos, pero carecen de la capacidad de conectarlos de forma segura a una capa de identidad unificada
Para solucionar esto, las marcas necesitan:
The Marketing Cloud, una agencia global de servicios de marketing y empresa de Stagwell, experimentó esta fricción de primera mano con sus clientes de marca. Impulsaron un modelo mejor: uno en el que las marcas pudieran acceder a las capacidades de coincidencia de identidades de Stagwell sin enviar nunca sus datos brutos fuera de su propia infraestructura.
Las implementaciones tradicionales de salas limpias requieren mucha interacción, un gran esfuerzo de ingeniería y pueden ser lentas de implementar.
Databricks Marketplace Apps cambian por completo el modelo tradicional de intercambio de datos. En lugar de "envíenos sus datos y los procesaremos", el modelo pasa a ser "instale nuestra aplicación y se ejecutará donde ya residen sus datos". Ahora, las marcas pueden instalar una aplicación precompilada, conectar sus datos y ejecutar flujos de trabajo de coincidencia de identidades al instante.
Cuando se publica una aplicación en Databricks Marketplace, cualquier marca con un espacio de trabajo de Databricks puede solicitar acceso e instalarla directamente. La aplicación se ejecuta dentro del propio entorno de la marca con su propio principal de servicio aprovisionado automáticamente. Los datos de la marca nunca cruzan el límite de la red.
Este es un cambio fundamental para los proveedores de datos. Anteriormente, distribuir algoritmos propietarios significaba exponer el código fuente (algo que los socios no harán) o exigir a las marcas que exportaran los datos (a lo que los equipos de cumplimiento se oponen). Las aplicaciones de Marketplace resuelven ambos problemas: el código de la aplicación está contenedorizado y es opaco para el consumidor, mientras que los datos de la marca permanecen en su Unity Catalog.
Con la distribución a través del marketplace, el tiempo de implementación se reduce de meses a minutos, los flujos de trabajo estandarizados mejoran la usabilidad y la gobernanza está integrada en la plataforma. Stagwell fue uno de los primeros socios en poner este modelo en producción.
Stagwell creó una aplicación de sala limpia lista para el marketplace en Databricks que permite la ingesta segura de datos de origen de la marca, la coincidencia con la columna vertebral de identidad de Stagwell, la generación de información que protege la privacidad y una transición fluida hacia la creación y activación de audiencias.
En su núcleo, el sistema combina Databricks Clean Rooms para una colaboración segura, Unity Catalog para la gobernanza y el control de acceso, Jobs y Notebooks para la ejecución de la coincidencia de identidades, y una capa de aplicación React y Express para la experiencia del usuario.

Así es como funciona el flujo de extremo a extremo.
La aplicación utiliza cuatro capas de identidad distintas, cada una de ellas adaptada a su propósito:
Token de usuario On-Behalf-Of (OBO): cuando el usuario de la marca inicia sesión, la aplicación recibe su token OAuth a través del encabezado x-forwarded-access-token. Este token se utiliza para cualquier operación que afecte a los datos de la marca: previsualizar tablas, realizar consultas en el SQL warehouse, recuperar el identificador de intercambio de la marca. Las ACLs de Unity Catalog se aplican en función de la identidad del usuario.
Service principal de la aplicación - El SP aprovisionado automáticamente gestiona las operaciones a nivel de aplicación: telemetría, gestión del estado interno y llamadas a la API de backend de Stagwell. Esta identidad está limitada a la propia aplicación y no incluye permisos a nivel de usuario.
Service principal del backend de Stagwell - Las propias credenciales OAuth M2M de Stagwell gestionan el ciclo de vida de la clean room por su parte: crear la clean room, añadir activos, aportar notebooks y designar a la marca como ejecutora.
Token de acceso personal (PAT) del usuario de la marca - El colaborador de la clean room de la marca genera un PAT con alcance limitado y permisos de clean room, SQL y Unity Catalog, y lo proporciona durante la instalación de la aplicación mediante la vinculación de recursos secretos (secret resource binding). Este token porta la identidad del usuario creador, lo que significa que funciona de forma nativa en todos los entornos de trabajo (workspaces) y permite realizar operaciones que requieren autorización a nivel de clean room en el lado de la marca, como añadir tablas de la marca y ejecutar el notebook de emparejamiento.
Las Clean Rooms estándar requieren un paso de aprobación: el colaborador revisa y aprueba antes de que se pueda ejecutar cualquier notebook. Esto tiene sentido para colaboraciones ad-hoc, pero genera fricción en un modelo de distribución de marketplace donde cientos de marcas podrían instalar la misma aplicación.
Las Packaged Clean Rooms eliminan esta fricción. Cuando Stagwell crea una clean room designada como packaged clean room, la marca puede ejecutar notebooks inmediatamente después de configurar la clean room. Sin colas de aprobación, sin idas y venidas, sin retrasos.
Esto es lo que hace que el modelo de marketplace sea viable a escala. Una marca instala la aplicación, conecta sus datos y ejecuta su primer emparejamiento de identidad (identity match) en cuestión de minutos, no de semanas.
La industria está experimentando un cambio fundamental: de un intercambio de datos estático, una incorporación manual e integraciones con un alto nivel de riesgo, se está pasando a una colaboración segura y gobernada, resolución de identidad bajo demanda y flujos de trabajo de datos convertidos en productos.
La aplicación de Stagwell demuestra un patrón que cualquier proveedor de datos puede seguir. Considere las posibilidades:
En cada caso, la propuesta de valor es la misma: el proveedor de datos monetiza su IP a través del Marketplace, mientras que el consumidor obtiene información valiosa (insights) y activa audiencias sin la sobrecarga de cumplimiento normativo que conlleva el intercambio de datos.
El enfoque de Stagwell ilustra cómo la profundidad de los datos amplifica este modelo. Su ID Spine combina señales de comportamiento con datos de actitud de The Harris Poll, Harris Quest Brand y National Research Group, fusionando lo que hacen los consumidores con lo que piensan para ofrecer una calidad de audiencia que va más allá del emparejamiento de identidad estándar.
Para las marcas, esto significa un acceso más rápido a la información valiosa (time to insight), una mejor comprensión de la audiencia, un cumplimiento más sólido de la privacidad y nuevas formas de activar sus datos de primera mano (first-party data). Para el ecosistema, las clean rooms y los marketplaces se están convirtiendo en el sistema operativo para la colaboración de datos.
Los bloques de construcción forman parte de la plataforma Databricks: Unity Catalog para el gobierno, Marketplace para la distribución, Packaged Clean Rooms para el c ómputo seguro para la privacidad, Delta Sharing para la entrega de resultados y Databricks Apps para el entorno de ejecución. Lo novedoso es cómo se integran para formar un canal de distribución completo para aplicaciones basadas en datos.
El futuro de la identidad no se trata solo de mejores grafos, sino de hacer que la resolución de identidad sea accesible, segura y escalable a través de experiencias convertidas en productos. Y eso es exactamente lo que permiten las aplicaciones de clean room impulsadas por el marketplace.
Si es un proveedor de datos que desea distribuir sus algoritmos y modelos a través de Databricks Marketplace, esto es lo que debe hacer a continuación:
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.