Direkt zum Hauptinhalt

Thumbtack ermöglicht sichere, smarte Heimdienste auf Databricks mit GenAI

Erfahren Sie, wie Thumbtack feinabgestimmte große Sprachmodelle, eine einheitliche ML-Plattform und Databricks nutzt, um Vertrauen, Sicherheit und Produktivität für Millionen von Hausbesitzern und Fachleuten zu steigern.

Thumbtack Powering Safe, Smart Home Services on Databricks with GenAI

Published: January 9, 2026

Führungskräfte im Datenbereich4 min read

Summary

  • Thumbtack verbindet Millionen von US-Hausbesitzern mit über 300.000 lokalen Dienstleistungsunternehmen und kombiniert GenAI und Databricks auf Google Cloud, um schnelle und vertrauenswürdige Erlebnisse bei Heimdiensten zu bieten.
  • Die Präzision bei der Nachrichtenüberprüfung erhöhte sich um das 3,7-fache und der Recall um das 1,5-fache, da feinabgestimmte LLMs und datenschutzorientierte Workflows skalierbares Vertrauen und Sicherheit ermöglichen.
  • Zentralisiertes MLflow und standardisierte Notebooks ermöglichen eine sichere, produktive Zusammenarbeit und beschleunigen den Kundennutzen über alle Geschäftsfunktionen hinweg.

Aufbau der vertrauenswürdigsten Plattform für häusliche Pflege

Die Mission von Thumbtack ist einfach, aber ehrgeizig: Menschen zu befähigen, ihre Häuser selbstbewusst und mühelos zu verwalten, indem wir jeden Dienst, jede Reparatur und Verbesserung zuverlässig und sicher machen. Wir unterstützen die lokale Wirtschaft, indem wir Millionen von Hausbesitzern landesweit mit über 300.000 qualifizierten Fachleuten verbinden, von Klempnern und Elektrikern bis hin zu Wellness-Anbietern und Event-Organisatoren. Die Möglichkeiten sind riesig, aber auch die Komplexität – unser Ziel ist es, für jeden Kunden jedes Mal konsistente, außergewöhnliche Ergebnisse sicherzustellen.

Den Wert von GenAI bei Thumbtack erschließen

Die rasante Entwicklung von Diensten für zu Hause und die steigenden Kundenerwartungen bedeuten, dass wir unsere Plattform kontinuierlich weiterentwickeln – Datenmengen, unvorhersehbare Kunden- und Fachkraftbedürfnisse und die Erweiterung der Dienstkategorien stellen technische und organisatorische Herausforderungen dar. Thumbtack war mit fragmentierten Data-Science- und Engineering-Workflows, isolierten Infrastrukturen und hohen Anforderungen an Datenschutz und Sicherheit konfrontiert.

Die Lösung dieser Herausforderungen erforderte mehr als nur intelligente Algorithmen oder eine schnellere Infrastruktur. Benötigt wurde eine vernetzte, vertrauenswürdige Daten- und Machine-Learning-Plattform, bei der Sicherheit, Datenschutz und Zusammenarbeit im Mittelpunkt stehen. Unser Ansatz: Vereinheitlichung unseres GenAI-Ökosystems auf Databricks, um eine echte, messbare Wirkung zu erzielen.

Vertrauenswürdige GenAI, zentralisierte Sicherheit und produktive Data Science

Stärkung von Vertrauen und Sicherheit durch feinabgestimmte LLMs

Die teilautomatisierte Pipeline zur Überprüfung von Nachrichten bei Thumbtack ist das Rückgrat unserer digitalen Vertrauensplattform. Jede Nachricht zwischen einem Kunden und einer Fachkraft wird sowohl von einer regelbasierten Engine als auch von einem Machine-Learning-Modell überprüft. Während typische Missbrauchsfälle mit einfachen Regeln erkannt werden können, können viele nuancierte Richtlinienverstöße dies nicht. Frühere Systeme, die auf Convolutional Neural Networks (CNNs) basierten, hatten Schwierigkeiten, zwischen Sarkasmus, Kontext oder impliziten Drohungen zu unterscheiden.

Die Feinabstimmung großer Sprachmodelle anhand der von Thumbtack selbst gelabelten Daten brachte eine sprunghafte Verbesserung. Mit unserem hybriden Workflow filtert ein CNN-Modell eindeutig unbedenkliche Nachrichten vor, wodurch die Arbeitslast des LLM um 80 % reduziert wird. Das feinabgestimmte LLM konzentriert seine Leistung dann auf die anspruchsvollsten 20 %, wodurch die Erkennungspräzision um das 3,7-Fache und der Recall um das 1,5-Fache erhöht werden. Jedes Jahr werden zig Millionen Nachrichten verarbeitet, was die Sicherheit von Konversationen gewährleistet, ehrliche Interaktionen aufrechterhält und unnötige Kosten vermeidet.

Aufbauend auf Databricks: Sicher, standardisiert und flexibel

Alle erweiterten KI- und Trust-Workflows bei Thumbtack laufen jetzt über eine einheitliche ML-Plattform, die auf Databricks basiert. Zu den wichtigsten Investitionen und Sicherheitsmaßnahmen gehören:

  • Zentralisiertes LLM-Workload-Management: Indem wir alle GenAI-Workloads auf Databricks ausführen, reduzieren wir unsere Angriffsfläche und sorgen für ein einheitliches Governance-Modell.
  • Workspace-Isolierung: Virtuelle private Clouds stellen sicher, dass sensible Daten geschützt bleiben, wobei granulare Berechtigungen über Tools wie Terraform verwaltet werden. Wir verwenden Unity Catalog, um Serverless zu ermöglichen, und Databricks Genie für den Zugriff auf BigQuery als Teil unserer sicheren Berechtigungsverwaltung.
  • Automatisierter Datenschutz: Open-Source- und intern entwickelte Scrubber entfernen personenbezogene Daten (PII) und vertrauliche Informationen aus Daten, während diese durch Notebooks, Modelle und Pipelines fließen.
  • Umfassende Beobachtbarkeit und Monitoring: Jedes Modell, jedes Notebook und jede API-Route wird hinsichtlich Data Drift und PII-Offenlegung nachverfolgt. Visualisierungstools bestätigen, dass keine risikobehafteten Daten in nachgelagerte Systeme durchsickern.
  • Zentralisiertes Management von Secrets und Artefakten: Mit MLflow und Secrets-Managern verwalten Teams Anmeldeinformationen sicher, versionieren alle Modelle und arbeiten produktiv zusammen – kein dezentrales, fehleranfälliges Kopieren und Einfügen von Keys oder Bibliotheken mehr.

Best Practices im GenAI-Betrieb

  • Hybride KI-Workloads: Produktionsdienste laufen auf AWS, während die Analysen in der Google Cloud stattfinden, aber alle GenAI-Workflows sind zur Gewährleistung der Reproduzierbarkeit zentralisiert und standardisiert.
  • Wiederverwendung und Effizienz: MLflow und Notebook-Tracking bedeuten, dass Experimente oder Lösungen über Engineering, SRE und Analytics hinweg geteilt, verglichen und erweitert werden können – und das alles mit einheitlichen Datenschutzkontrollen.
  • Proaktive Datenschutzmaßnahmen: Thumbtack passt Open Source PII-Scrubber an seine spezifischen Bedürfnisse an und erzwingt das Monitoring auf jeder Ebene. Branchentrends deuten darauf hin, dass PII-bezogene Sicherheitsverletzungen bei Notebooks und Modellen seit 2022 um 300 % zugenommen haben, was diese Schutzmaßnahmen geschäftskritisch macht.

Mehr Sicherheit, mehr Vertrauen, mehr Innovation

  • Marketplace-Scale: Millionen von US-Nutzern und mehr als 300.000 lokale Dienstleistungsunternehmen interagieren jetzt auf einer Plattform, bei der Sicherheit und Zuverlässigkeit an erster Stelle stehen.
  • Überlegene Nachrichtenfilterung: Präzision um das 3,7-fache und Recall um das 1,5-fache verbessert, Kostenkontrolle durch Verarbeitung nur der 20 % risikoreichsten Nachrichten mit LLMs bei gleichzeitiger Gewährleistung des Datenschutzes in jedem Schritt.
  • Zusammenarbeit und Effizienz: Zentralisierte, reproduzierbare ML-Workflows eliminieren manuelle Übergaben und ermöglichen schnelle teamübergreifende Innovationen, sodass Data Scientists, SREs und ML-Engineers synchron arbeiten können.
  • Vertrauen in die Scale: Mit robusten technischen und prozessualen Kontrollen erfüllt Thumbtack seine Mission, der vertrauenswürdigste und transparenteste Marketplace für Dienstleistungen rund ums Haus zu sein.

Während Thumbtack seine GenAI-Reise fortsetzt, wird jedes Team befähigt, zu experimentieren, zusammenzuarbeiten und sicherere, intelligentere Erlebnisse bei Heimdiensten zu schaffen. Die Strategie basiert auf realen Auswirkungen und zeigt, wie KI, Datenschutz und Plattformdenken zusammenwirken, um einen Mehrwert für Fachleute und Hausbesitzer zu schaffen.

Sehen Sie sich die Thumbtack-Präsentation Boosting Data Science and KI Productivity With Databricks Notebooks auf dem Data + AI Summit 2025 an.

 

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Was kommt als Nächstes?

how 7 eleven inc bilt a game changing genai creative assistant for marketing with mosaic ai in og image

Líder de dados

October 16, 2025/8 min de leitura

Como a 7-Eleven, Inc. Criação de um assistente criativo de GenAI revolucionário para marketing com o Mosaic AI

Supercharging AI Model Building: Data and Task Parallelism with Ray and Databricks

Líder de dados

November 6, 2025/8 min de leitura

Potencializando a criação de modelos de AI: paralelismo de dados e de tarefa com Ray e Databricks