Die Mission von Thumbtack ist einfach, aber ehrgeizig: Menschen zu befähigen, ihre Häuser selbstbewusst und mühelos zu verwalten, indem wir jeden Dienst, jede Reparatur und Verbesserung zuverlässig und sicher machen. Wir unterstützen die lokale Wirtschaft, indem wir Millionen von Hausbesitzern landesweit mit über 300.000 qualifizierten Fachleuten verbinden, von Klempnern und Elektrikern bis hin zu Wellness-Anbietern und Event-Organisatoren. Die Möglichkeiten sind riesig, aber auch die Komplexität – unser Ziel ist es, für jeden Kunden jedes Mal konsistente, außergewöhnliche Ergebnisse sicherzustellen.
Die rasante Entwicklung von Diensten für zu Hause und die steigenden Kundenerwartungen bedeuten, dass wir unsere Plattform kontinuierlich weiterentwickeln – Datenmengen, unvorhersehbare Kunden- und Fachkraftbedürfnisse und die Erweiterung der Dienstkategorien stellen technische und organisatorische Herausforderungen dar. Thumbtack war mit fragmentierten Data-Science- und Engineering-Workflows, isolierten Infrastrukturen und hohen Anforderungen an Datenschutz und Sicherheit konfrontiert.
Die Lösung dieser Herausforderungen erforderte mehr als nur intelligente Algorithmen oder eine schnellere Infrastruktur. Benötigt wurde eine vernetzte, vertrauenswürdige Daten- und Machine-Learning-Plattform, bei der Sicherheit, Datenschutz und Zusammenarbeit im Mittelpunkt stehen. Unser Ansatz: Vereinheitlichung unseres GenAI-Ökosystems auf Databricks, um eine echte, messbare Wirkung zu erzielen.
Die teilautomatisierte Pipeline zur Überprüfung von Nachrichten bei Thumbtack ist das Rückgrat unserer digitalen Vertrauensplattform. Jede Nachricht zwischen einem Kunden und einer Fachkraft wird sowohl von einer regelbasierten Engine als auch von einem Machine-Learning-Modell überprüft. Während typische Missbrauchsfälle mit einfachen Regeln erkannt werden können, können viele nuancierte Richtlinienverstöße dies nicht. Frühere Systeme, die auf Convolutional Neural Networks (CNNs) basierten, hatten Schwierigkeiten, zwischen Sarkasmus, Kontext oder impliziten Drohungen zu unterscheiden.
Die Feinabstimmung großer Sprachmodelle anhand der von Thumbtack selbst gelabelten Daten brachte eine sprunghafte Verbesserung. Mit unserem hybriden Workflow filtert ein CNN-Modell eindeutig unbedenkliche Nachrichten vor, wodurch die Arbeitslast des LLM um 80 % reduziert wird. Das feinabgestimmte LLM konzentriert seine Leistung dann auf die anspruchsvollsten 20 %, wodurch die Erkennungspräzision um das 3,7-Fache und der Recall um das 1,5-Fache erhöht werden. Jedes Jahr werden zig Millionen Nachrichten verarbeitet, was die Sicherheit von Konversationen gewährleistet, ehrliche Interaktionen aufrechterhält und unnötige Kosten vermeidet.
Alle erweiterten KI- und Trust-Workflows bei Thumbtack laufen jetzt über eine einheitliche ML-Plattform, die auf Databricks basiert. Zu den wichtigsten Investitionen und Sicherheitsmaßnahmen gehören:
Während Thumbtack seine GenAI-Reise fortsetzt, wird jedes Team befähigt, zu experimentieren, zusammenzuarbeiten und sicherere, intelligentere Erlebnisse bei Heimdiensten zu schaffen. Die Strategie basiert auf realen Auswirkungen und zeigt, wie KI, Datenschutz und Plattformdenken zusammenwirken, um einen Mehrwert für Fachleute und Hausbesitzer zu schaffen.
Sehen Sie sich die Thumbtack-Präsentation Boosting Data Science and KI Productivity With Databricks Notebooks auf dem Data + AI Summit 2025 an.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Líder de dados
October 16, 2025/8 min de leitura
Líder de dados
November 6, 2025/8 min de leitura


