Direkt zum Hauptinhalt
Lösungen

Wie Stagwell datenschutzsicheres ID-Matching auf Databricks aufgebaut hat

Databricks Marketplace Apps und Packaged Clean Rooms ermöglichen es Datenanbietern, IP als installierbare Anwendungen bereitzustellen, sodass die Daten von Marken dort bleiben, wo sie hingehören.

von Sridhar Sundaresan und Suvan Kaul

  • Marken haben Schwierigkeiten, fragmentierte First-Party-Daten sicher mit Identity Graphs abzugleichen, ohne sensible Informationen preiszugeben.
  • Clean-Room-Apps auf dem Databricks Marketplace ermöglichen einen unkomplizierten, datenschutzfreundlichen Identitätsabgleich in großem Maßstab, sodass die Daten die Umgebung des Kunden niemals verlassen.
  • Die Lösung von Stagwell kombiniert Databricks Clean Rooms, Stagwell ID Spine und App-Orchestrierung, um über ihr Agentic Targeting System (SATS) von Rohdaten zu aktivierbaren Zielgruppen zu gelangen – und das alles, ohne Rohdaten von einer der beiden Seiten offenzulegen.

Das Problem des Identitätsabgleichs, vor dem Marken heute stehen

Marken investieren stark in den Aufbau von First-Party-Datenbeständen, einschließlich Kaufhistorien, CRM-Einträgen, Treueprogrammen und Website-Interaktionen. Diese Daten sind über verschiedene Systeme hinweg fragmentiert und lassen sich nur schwer kanalübergreifend aktivieren. First-Party-Daten allein erzählen jedoch nur einen Teil der Geschichte.

Um vollständige Zielgruppenprofile zu erstellen, müssen Marken ihre Datensätze mit den Basisdaten (Spines) von Identity-Providern abgleichen, um kanalübergreifende Identity Graphs zu erstellen, die E-Mails, Geräte-IDs, Cookies und Offline-Touchpoints abdecken.

Der traditionelle Ansatz ist mühsam. Marken exportieren Kundendaten auf eine Plattform von Drittanbietern, der Identity-Provider führt seine Matching-Algorithmen aus und die Ergebnisse liegen erst Tage später vor. Jeder Schritt birgt Risiken: Daten verlassen die sichere Umgebung der Marke, PII wird über Netzwerke übertragen und Compliance-Teams müssen Vereinbarungen zur Datenfreigabe prüfen, deren Aushandlung Wochen dauern kann.

Gleichzeitig haben Datenschutzbestimmungen und Plattformbeschränkungen dazu geführt, dass:

  • Third-Party-Cookies unzuverlässig geworden sind
  • die Datenfreigabe riskant ist
  • Identity Stitching komplexer geworden ist

Dadurch entsteht eine fundamentale Lücke: Marken verfügen zwar über Daten, haben aber nicht die Möglichkeit, diese sicher mit einer einheitlichen Identitätsebene (Identity Layer) zu verknüpfen.

Um diese Lücke zu schließen, müssen Marken:

  • ihre Daten mit einem umfassenden Identity Graph abgleichen
  • sie mit zusätzlichen Signalen und Attributen anreichern
  • dies tun und gleichzeitig die Rohdaten auf Nutzerebene schützen

The Marketing Cloud, eine Global Marketing Services Agency und ein Unternehmen von Stagwell, hat diese Reibungspunkte bei ihren Markenkunden aus erster Hand erfahren. Sie drängten auf ein besseres Modell: eines, bei dem Marken auf die Identity-Matching-Funktionen von Stagwell zugreifen können, ohne ihre Rohdaten jemals aus ihrer eigenen Infrastruktur nach außen zu senden.

Wie Marketplace-Apps das Vertriebsmodell verändern

Herkömmliche Clean-Room-Implementierungen sind betreuungsintensiv, technisch aufwendig und können nur langsam bereitgestellt werden.

Databricks Marketplace-Apps stellen das traditionelle Modell der Datenfreigabe auf den Kopf. Statt „Senden Sie uns Ihre Daten und wir verarbeiten sie“ lautet das Modell nun „Installieren Sie unsere App und sie läuft dort, wo sich Ihre Daten bereits befinden“. Marken können jetzt eine vorgefertigte Anwendung installieren, ihre Daten verknüpfen und sofort Workflows für den Identitätsabgleich ausführen.

Wenn eine Anwendung im Databricks Marketplace veröffentlicht wird, kann jede Marke mit einem Databricks-Workspace Zugriff anfordern und sie direkt installieren. Die App läuft innerhalb der eigenen Umgebung der Marke mit einem eigenen, automatisch bereitgestellten Service Principal. Die Daten der Marke verlassen dabei niemals die Netzwerkgrenzen.

Dies ist ein grundlegender Wandel für Datenanbieter. Bisher bedeutete der Vertrieb proprietärer Algorithmen entweder die Offenlegung des Quellcodes (was Partner nicht tun wollen) oder die Anforderung an Marken, Daten zu exportieren (wogegen sich Compliance-Teams sträuben). Marketplace-Apps lösen beide Probleme: Der Code der App ist containerisiert und für den Nutzer nicht einsehbar, während die Daten der Marke in ihrem Unity Catalog verbleiben.

Mit dem Vertrieb über den Marketplace sinkt die Bereitstellungszeit von Monaten auf Minuten, standardisierte Workflows verbessern die Benutzerfreundlichkeit und die Governance ist direkt in die Plattform integriert. Stagwell gehörte zu den ersten Partnern, die dieses Modell in die Praxis umgesetzt haben.

Was Stagwell entwickelt hat und wie es funktioniert

Stagwell hat eine marktplatzfähige Clean-Room-Anwendung auf Databricks entwickelt, die eine sichere Erfassung von First-Party-Daten der Marke, den Abgleich mit der Stagwell Identity Spine, die datenschutzkonforme Generierung von Erkenntnissen und einen nahtlosen Übergang zur Erstellung und Aktivierung von Zielgruppen ermöglicht.

Im Kern kombiniert das System Databricks Clean Rooms für eine sichere Zusammenarbeit, Unity Catalog für Governance und Zugriffskontrolle, Jobs und Notebooks für die Ausführung des Identitätsabgleichs sowie eine React- und Express-App-Ebene für die User Experience.

image1.png

Und so funktioniert der End-to-End-Ablauf.

  • Schritt 1: Installieren und authentifizieren
    • Ein Administrator aufseiten der Marke findet die App von Stagwell im Databricks Marketplace und installiert sie in seinem Workspace. Während der Installation muss der Admin die App autorisieren und an die benötigten Ressourcen binden: ein SQL-Warehouse für Abfragen und eventuelle Secrets für die Konfiguration. Die App erhält einen automatisch bereitgestellten Service Principal, dessen Anmeldedaten als Umgebungsvariablen eingefügt werden. Es ist keine manuelle Einrichtung von Anmeldedaten erforderlich.
  • Schritt 2: Markendaten verbinden
    • Wenn ein Markennutzer die App öffnet, authentifiziert er sich über den standardmäßigen OAuth-Flow seines Workspaces. Die App verwendet die On-Behalf-Of (OBO)-Autorisierung, um mit der Identität des angemeldeten Benutzers auf die Daten der Marke zuzugreifen. Das bedeutet, dass jede Unity Catalog-ACL, jeder Zeilenfilter und jede Spaltenmaske automatisch angewendet wird. Die App sieht genau das, wozu dieser Benutzer berechtigt ist – nicht mehr.
  • Schritt 3: Den Clean-Room-Abgleich initiieren
    • Der Markennutzer wählt aus, welche First-Party-Tabellen abgeglichen werden sollen, und stößt den Prozess an. Im Hintergrund ruft die App das Backend von Stagwell auf, um einen Packaged Clean Room zu erstellen. Stagwell steuert seine Identity-Spine-Daten und ein passendes Notebook bei und bestimmt die Marke als Ausführer (Runner).
    • Die Kennzeichnung als „Packaged“ (vorgefertigt) ist entscheidend: Sie macht den Genehmigungs-Workflow überflüssig, den Standard-Clean-Rooms erfordern. Die Marke kann das Matching-Notebook sofort ausführen. Und was besonders wichtig ist: Die Marke kann zwar den Namen des Notebooks sehen, nicht aber dessen Quellcode – wodurch die proprietäre Matching-Logik von Stagwell geschützt bleibt.
  • Schritt 4: Den Identitätsabgleich ausführen
    • Die Marke führt das Matching-Notebook im Clean Room aus, das die folgenden Operationen durchführt:
      • Zusammenführung (Join) der Markendaten mit der ID-Spine
      • Auflösung von Identitäten über mehrere Identifikatoren hinweg
      • Berechnung von:
        • Übereinstimmungsraten (Match Rates)
        • Abdeckungsmetriken (Coverage Metrics)
        • Haushalts- und Verbraucher-IDs
    • Das Notebook liest aus den Input-Katalogen beider Parteien und schreibt die Ergebnisse in ein gemeinsames Output-Schema. Sowohl Stagwell als auch die Marke können die Abgleichergebnisse über Delta Sharing einsehen.
    • Die Rohdaten der Kunden der Marke sind für Stagwell niemals sichtbar. Die Matching-Algorithmen von Stagwell sind für die Marke niemals sichtbar. Der Clean Room erzwingt diese Trennung auf Plattformebene.
    • Die gesamte Verarbeitung findet innerhalb der Grenzen des Clean Rooms statt, was jeglichen Abfluss von Rohdaten verhindert und eine vollständige Durchsetzung der Richtlinien gewährleistet.
  • Schritt 5: Vom Abgleich zur Aktivierung
    • Sobald der Abgleich abgeschlossen ist, liefert die App Erkenntnisse wie Demografie, Verhaltenssegmente, geografische Verteilung und Aufschlüsselung nach Geräten. Zu den Ergebnissen gehören aggregierte Datensätze und eine chatbasierte Benutzeroberfläche zur Generierung wichtiger Erkenntnisse aus den abgeglichenen Daten. Diese Ergebnisse können exportiert oder in nachgelagerten Plattformen aktiviert werden.
    • Der Identitätsabgleich ist erst der Anfang. Sobald die Abgleichergebnisse vorliegen, müssen Marken die angereicherten Zielgruppenprofile in die Praxis umsetzen.
    • In Fällen, in denen die First-Party-Daten einer Marke keine vollständige Übereinstimmung erzielen, arbeitet die Crosswalk-Anwendung von Stagwell mit zusätzlichen Identity-Providern zusammen, um ein hochpräzises nachgelagertes Matching und eine umfassende Zielgruppenabdeckung zu gewährleisten.
    • Von dort aus aktivieren Marken ihre angereicherten Zielgruppen über das Stagwell Agentic Targeting System (SATS) – eine AI-gestützte Lösung, mit der Marketingteams Zielgruppen im Dialog suchen, entdecken und bereitstellen können, wodurch der Kreislauf von der Datenanreicherung bis zur Medienaktivierung geschlossen wird.

Die Authentifizierungsarchitektur im Detail

Die App verwendet vier verschiedene Identitätsebenen, die jeweils auf ihren Zweck abgestimmt sind:

On-Behalf-Of (OBO)-Benutzertoken – Wenn sich der Markennutzer anmeldet, erhält die App sein OAuth-Token über den Header x-forwarded-access-token. Dieses Token wird für alle Operationen verwendet, die die Daten der Marke betreffen: Vorschau von Tabellen, Abfragen des SQL-Warehouses, Abrufen des Sharing-Identifikators der Marke. Die Unity Catalog-ACLs werden basierend auf der Identität des Benutzers angewendet.

App-Service-Prinzipal – Der automatisch bereitgestellte SP verarbeitet Vorgänge auf App-Ebene: Telemetrie, interne Zustandsverwaltung und Aufrufe der Backend-API von Stagwell. Diese Identität ist auf die App selbst beschränkt und enthält keine Berechtigungen auf Benutzerebene.

Stagwell-Backend-Service-Prinzipal – Die Stagwell-eigenen M2M-OAuth-Anmeldedaten verwalten den Lebenszyklus des Clean Rooms auf ihrer Seite: Erstellen des Clean Rooms, Hinzufügen von Assets, Bereitstellen von Notebooks und Festlegen der Marke als Runner.

Persönliches Zugriffstoken (PAT) des Markenbenutzers – Der Clean-Room-Kollaborateur der Marke generiert ein bereichsbezogenes PAT mit Berechtigungen für Clean Rooms, SQL und Unity Catalog und stellt dieses bei der App-Installation über eine geheime Ressourcenbindung bereit. Dieses Token trägt die Identität des generierenden Benutzers. Das bedeutet, dass es nativ über Workspaces hinweg funktioniert und Vorgänge ermöglicht, die eine Autorisierung auf Clean-Room-Ebene auf der Markenseite erfordern – wie das Hinzufügen von Markentabellen und das Ausführen des Matching-Notebooks.

Warum Packaged Clean Rooms für den Vertrieb über den Marketplace wichtig sind

Standard-Clean-Rooms erfordern einen Genehmigungsschritt: Der Kollaborateur prüft und genehmigt, bevor ein Notebook ausgeführt werden kann. Das ist bei Ad-hoc-Partnerschaften sinnvoll, führt jedoch bei einem Marketplace-Vertriebsmodell, bei dem Hunderte von Marken dieselbe App installieren könnten, zu Reibungsverlusten.

Packaged Clean Rooms beseitigen diese Reibungspunkte. Wenn Stagwell einen Clean Room erstellt, der als Packaged Clean Room gekennzeichnet ist, kann die Marke Notebooks sofort nach dem Einrichten des Clean Rooms ausführen. Keine Warteschlange für Genehmigungen, kein Hin und Her, keine Verzögerungen.

Genau das macht das Marketplace-Modell in großem Maßstab rentabel. Eine Marke installiert die App, verknüpft ihre Daten und führt in wenigen Minuten ihren ersten Identity Match aus – nicht erst in Wochen.

Was das für das Ökosystem der Datenkollaboration bedeutet

Die Branche erlebt einen grundlegenden Wandel: weg von statischer Datenfreigabe, manuellem Onboarding und risikoreichen Integrationen hin zu sicherer, kontrollierter Zusammenarbeit, On-Demand-Identitätsauflösung und produktisierten Daten-Workflows.

Die App von Stagwell zeigt ein Muster, dem jeder Datenanbieter folgen kann. Denken Sie an die Möglichkeiten:

  • Ein Retail-Media-Netzwerk verpackt sein Attributionsmodell als Marketplace-App, sodass CPG-Marken den Kampagnen-Lift messen und hochwertige Segmente aktivieren können, ohne Kaufdaten freizugeben.
  • Ein Unternehmen für Gesundheitsdaten vertreibt ein Tool zur Abstimmung von Patientenkohorten und zur Koordinierung von Kontaktaufnahmen, das in den eigenen Databricks-Umgebungen von Krankenhaus-Systemen ausgeführt wird.
  • Ein Finanzdatenanbieter bietet Kreditrisiko-Anreicherung und die Aktivierung vorqualifizierter Angebote an, bei der Bankkundendaten verarbeitet werden, ohne dass diese Daten jemals den Workspace der Bank verlassen.

In jedem Fall ist das Wertversprechen dasselbe: Der Datenanbieter monetarisiert seine IP über den Marketplace, während der Verbraucher Erkenntnisse gewinnt und Zielgruppen aktiviert, ohne den Compliance-Aufwand einer Datenfreigabe.

Der Ansatz von Stagwell veranschaulicht, wie Datentiefe dieses Modell verstärkt. Ihr ID Spine kombiniert Verhaltenssignale mit Einstellungsdaten von The Harris Poll, Harris Quest Brand und der National Research Group – und verbindet das Verhalten der Verbraucher mit ihren Gedanken, um eine Zielgruppenqualität zu liefern, die über das standardmäßige Identity Matching hinausgeht.

Für Marken bedeutet dies eine schnellere Gewinnung von Erkenntnissen, ein besseres Verständnis der Zielgruppe, eine stärkere Einhaltung des Datenschutzes und neue Möglichkeiten zur Aktivierung ihrer First-Party-Daten. Für das Ökosystem werden Clean Rooms und Marketplaces zum Betriebssystem für die Datenkollaboration.

Die Bausteine sind alle Teil der Databricks-Plattform: Unity Catalog für Governance, Marketplace für den Vertrieb, Packaged Clean Rooms für datenschutzsichere Berechnungen, Delta Sharing für die Bereitstellung von Ergebnissen und Databricks Apps für die Laufzeitumgebung. Neu ist, wie sie sich zu einem vollständigen Vertriebskanal für datengesteuerte Anwendungen zusammensetzen.

Bei der Zukunft der Identität geht es nicht nur um bessere Graphen – es geht darum, die Identitätsauflösung durch produktisierte Erlebnisse zugänglich, sicher und skalierbar zu machen. Und genau das ermöglichen Marketplace-gesteuerte Clean-Room-Apps.

Erste Schritte

Wenn Sie ein Datenanbieter sind und Ihre Algorithmen und Modelle über den Databricks Marketplace vertreiben möchten, sollten Sie als Nächstes Folgendes tun:

  1. Lesen Sie den Leitfaden Partner Well-Architected Framework über das Erstellen von Marketplace-Apps, um mehr über Architekturmuster und Best Practices für die Sicherheit zu erfahren.
  2. Erkunden Sie die Dokumentation zu Databricks Clean Rooms, um zu verstehen, wie Packaged Clean Rooms datenschutzsichere Berechnungen ermöglichen.
  3. Probieren Sie den Schnellstart für Databricks Apps aus, um Ihre erste App zu erstellen und bereitzustellen. Testen Sie sie anschließend, indem Sie sie in einem separaten Workspace ohne vorherige Einrichtung installieren.
  4. Wenden Sie sich an Ihr Databricks-Account-Team, um die Veröffentlichung und den Vertrieb im Marketplace zu besprechen.

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.