Revenir au contenu principal

Thumbtack utilise la GenAI sur Databricks pour des services à domicile sûrs et intelligents

Découvrez comment Thumbtack tire parti de grands modèles linguistiques affinés, d'une plateforme de ML unifiée et de Databricks pour renforcer la confiance, la sécurité et la productivité de millions de propriétaires et de professionnels.

Thumbtack Powering Safe, Smart Home Services on Databricks with GenAI

Published: January 9, 2026

Leaders des données6 min read

Summary

  • Thumbtack met en relation des millions de propriétaires américains et plus de 300 000 entreprises de services locales, en combinant la GenAI et Databricks sur Google Cloud pour offrir des expériences de services à domicile rapides et fiables.
  • La précision de l'examen des messages a été multipliée par 3,7, et le rappel par 1,5, grâce à des LLM affinés et à des flux de travail axés sur la confidentialité qui renforcent la confiance et la sécurité à grande échelle.
  • MLflow centralisé et notebooks standardisés permettent une collaboration sécurisée et productive, accélérant la valeur client dans toutes les fonctions de l'entreprise.

Construire la plateforme de services à domicile la plus fiable

La mission de Thumbtack est simple mais ambitieuse : permettre aux gens de gérer leur maison en toute confiance et sans effort en rendant chaque service, réparation et amélioration fiable et sûr. Nous soutenons les économies locales en mettant en relation des millions de propriétaires dans tout le pays avec plus de 300 000 professionnels qualifiés, des plombiers et électriciens aux prestataires de bien-être et organisateurs d'événements. L'opportunité est immense, tout comme la complexité. Notre objectif est de garantir des résultats constants et exceptionnels pour chaque client, à chaque fois.

Valoriser la GenAI chez Thumbtack

L'évolution rapide des services à domicile et les attentes croissantes des clients signifient que nous améliorons continuellement notre plateforme — les volumes de données, les besoins imprévisibles des clients et des professionnels, et l'expansion des catégories de services présentent des défis techniques et organisationnels. Thumbtack était confrontée à des workflows de Data Science et de Data Engineering fragmentés, une infrastructure en silos et des exigences élevées en matière de confidentialité et de sécurité.

Relever ces défis a exigé plus que des algorithmes intelligents ou une infrastructure plus rapide. Cela a nécessité une plateforme de données et de machine learning connectée et digne de confiance qui place la sécurité, la confidentialité et la collaboration au cœur de ses préoccupations. Notre approche : unifier notre écosystème GenAI sur Databricks pour générer un impact réel et mesurable.

GenAI de confiance, sécurité centralisée et Data Science productive

Renforcer la confiance et la sécurité avec des LLM affinés

Le pipeline semi-automatisé d'examen des messages de Thumbtack est la colonne vertébrale de notre plateforme de confiance digital. Chaque message, entre un client et un professionnel, est analysé à la fois par un moteur basé sur des règles et par un modèle de machine learning. Si les cas d'abus classiques peuvent être détectés par des règles simples, de nombreuses violations de règles plus nuancées ne le peuvent pas. Les premiers systèmes basés sur les réseaux de neurones convolutifs (CNN) avaient du mal à faire la différence entre le sarcasme, le contexte ou les menaces implicites.

L'affinement des grands modèles de langage sur les propres données étiquetées de Thumbtack a fait une différence radicale. Avec notre flux de travail hybride, un modèle CNN pré-filtre les messages clairement acceptables, réduisant la charge de travail du LLM de 80 %. Le LLM affiné concentre ensuite sa puissance sur les 20 % les plus difficiles, multipliant la précision de la détection par 3,7 et le rappel par 1,5. Des dizaines de millions de messages sont traités chaque année, garantissant la sécurité des conversations tout en maintenant des interactions honnêtes et en évitant des coûts superflus.

Développé sur Databricks : sécurisé, standardisé et flexible

Tous les workflows d'IA avancée et de confiance chez Thumbtack s'exécutent désormais sur une plateforme de ML unifiée basée sur Databricks. Les principaux investissements et mesures de protection sont les suivants :

  • Gestion centralisée des charges de travail LLM : en exécutant toutes les charges de travail GenAI sur Databricks, nous réduisons notre surface d'attaque et maintenons un modèle de gouvernance cohérent.
  • Workspace isolation: les clouds privés virtuels garantissent la protection des données sensibles, avec des autorisations granulaires gérées par des outils comme Terraform. Nous utilisons Unity Catalog pour activer le mode serverless et Databricks Genie pour accéder à BigQuery, dans le cadre de la gestion sécurisée des autorisations.
  • Protection automatisée de la confidentialité : Des nettoyeurs open source et développés en interne suppriment les informations personnellement identifiables (PII) et les informations confidentielles des données lorsqu'elles transitent par les notebooks, les modèles et les pipelines.
  • Observabilité et monitoring complets : chaque modèle, Notebook et route d'API fait l'objet d'un suivi pour détecter le drift des données et l'exposition de données à caractère personnel (PII). Les outils de visualisation confirment que les données à risque ne fuient pas vers les systèmes en aval.
  • Gestion centralisée des secrets et des artefacts : avec MLflow et les gestionnaires de secrets, les équipes gèrent les informations d'identification en toute sécurité, versionnent tous les modèles et collaborent de manière productive. Fini le copier-coller décentralisé et peu fiable de clés ou de bibliothèques.

Bonnes pratiques en matière d'opérations de GenAI

  • Charges de travail d'IA hybrides : les services de production s'exécutent sur AWS avec des analytique sur Google Cloud, mais tous les flux de travail GenAI sont centralisés et normalisés pour garantir la reproductibilité.
  • Réutilisation et efficacité : MLflow et le suivi des Notebooks permettent de partager, de comparer et d'étendre les expérimentations ou les Solutions entre le Data Engineering, les SRE et l'analytique, le tout avec des contrôles de confidentialité cohérents.
  • Mesures de protection de la vie privée proactives : Thumbtack personnalise les outils open source de nettoyage des données à caractère personnel (PII) en fonction de ses besoins spécifiques et impose un monitoring à chaque niveau. Les tendances des secteurs d'activité indiquent que les violations de Notebooks et de modèles liées aux données à caractère personnel (PII) ont augmenté de 300 % depuis 2022, ce qui rend ces protections essentielles pour l'entreprise.

Plus de sécurité, plus de confiance, plus d'innovation

  • Échelle de la marketplace : des millions d'utilisateurs américains et plus de 300 000 entreprises de services locales interagissent désormais au sein d'une plateforme qui donne la priorité à la sécurité et à la fiabilité.
  • Filtrage des messages amélioré : précision multipliée par 3,7, rappel multiplié par 1,5, coûts maîtrisés en ne traitant que les 20 % des messages les plus risqués avec des LLM tout en garantissant la confidentialité à chaque étape.
  • Collaboration et efficacité : les flux de travail de ML centralisés et reproductibles éliminent les transferts manuels et permettent une innovation inter-équipes rapide, autorisant les data scientists, les SRE et les ingénieurs ML à travailler en synchronisation.
  • Montée en charge en toute confiance : Grâce à de solides contrôles techniques et de processus, Thumbtack remplit sa mission d'être la place de marché la plus fiable et la plus transparente pour les services à domicile.

Alors que Thumbtack poursuit son parcours GenAI, chaque équipe a les moyens d'expérimenter, de collaborer et de proposer des expériences de services à domicile plus sûres et plus intelligentes. Cette stratégie est ancrée dans un impact concret, démontrant comment l'IA, la confidentialité et une réflexion axée sur la plateforme se combinent pour créer de la valeur à la fois pour les professionnels et les propriétaires.

Regardez la présentation de Thumbtack Boosting Data Science and AI Productivity With Databricks Notebooks au Data + AI Summit 2025.

 

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Ne manquez jamais un article Databricks

Abonnez-vous à notre blog et recevez les derniers articles dans votre boîte mail.

Et ensuite ?

how 7 eleven inc bilt a game changing genai creative assistant for marketing with mosaic ai in og image

Líder de dados

October 16, 2025/8 min de leitura

Como a 7-Eleven, Inc. Criação de um assistente criativo de GenAI revolucionário para marketing com o Mosaic AI

Supercharging AI Model Building: Data and Task Parallelism with Ray and Databricks

Líder de dados

November 6, 2025/8 min de leitura

Potencializando a criação de modelos de AI: paralelismo de dados e de tarefa com Ray e Databricks