Passa al contenuto principale

Thumbtack potenzia servizi per la casa sicuri e intelligenti su Databricks con la GenAI

Scopri come Thumbtack sfrutta modelli linguistici di grandi dimensioni perfezionati, una piattaforma di ML unificata e Databricks per aumentare la fiducia, la sicurezza e la produttività per milioni di proprietari di case e professionisti.

Thumbtack Powering Safe, Smart Home Services on Databricks with GenAI

Published: January 9, 2026

Leader dei dati5 min read

Summary

  • Thumbtack mette in contatto milioni di proprietari di case negli Stati Uniti e oltre 300.000 aziende di servizi locali, combinando GenAI e Databricks su Google Cloud per offrire esperienze di servizi per la casa veloci e affidabili.
  • La precisione nella revisione dei messaggi è aumentata di 3,7 volte, con un richiamo in crescita di 1,5 volte, poiché gli LLM perfezionati e i flussi di lavoro incentrati sulla privacy potenziano la fiducia e la sicurezza scalabili.
  • MLflow centralizzato e notebook standardizzati consentono una collaborazione sicura e produttiva, accelerando il valore per il cliente in tutte le funzioni aziendali.

Creazione della piattaforma per l'assistenza domestica più affidabile

La missione di Thumbtack è semplice ma ambiziosa: consentire alle persone di gestire le proprie case con sicurezza e senza sforzo, rendendo ogni servizio, riparazione e miglioria affidabile e sicuro. Sosteniamo le economie locali mettendo in contatto milioni di proprietari di case in tutto il paese con oltre 300.000 professionisti qualificati, da idraulici ed elettricisti a fornitori di servizi per il benessere e organizzatori di eventi. L'opportunità è enorme, ma lo è anche la complessità: il nostro obiettivo è garantire risultati costanti ed eccezionali per ogni cliente, ogni volta.

Sfruttare il valore della GenAI in Thumbtack

La rapida evoluzione dei servizi per la casa e le crescenti aspettative dei clienti ci impongono di migliorare continuamente la nostra piattaforma: volumi di dati, esigenze imprevedibili di clienti e professionisti e categorie di servizi in espansione presentano sfide tecniche e organizzative. Thumbtack ha dovuto affrontare flussi di lavoro di Data Science e ingegneria frammentati, un'infrastruttura a silos e standard elevati per la privacy e la sicurezza.

Risolvere queste sfide ha richiesto più che algoritmi intelligenti o un'infrastruttura più veloce. Ha richiesto una piattaforma dati e di machine learning connessa e affidabile che mettesse al centro la sicurezza, la privacy e la collaborazione. Il nostro approccio: unificare il nostro ecosistema GenAI su Databricks per generare un impatto reale e misurabile.

GenAI affidabile, sicurezza centralizzata e data science produttiva

Aumentare la fiducia e la sicurezza con LLM ottimizzati

La pipeline semi-automatizzata di revisione dei messaggi di Thumbtack è la spina dorsale della nostra piattaforma di fiducia digitale. Ogni messaggio, tra un cliente e un professionista, viene esaminato sia da un motore basato su regole sia da un modello di machine learning. Mentre i casi di abuso tipici possono essere individuati con regole semplici, molte violazioni delle policy più complesse non possono esserlo. I primi sistemi basati su reti neurali convoluzionali (CNN) avevano difficoltà a distinguere tra sarcasmo, contesto o minacce implicite.

Il fine-tuning di modelli linguistici di grandi dimensioni sui dati etichettati di Thumbtack ha prodotto un cambiamento radicale. Con il nostro flusso di lavoro ibrido, un modello CNN pre-filtra i messaggi chiaramente validi, riducendo il carico di lavoro dell'LLM dell'80%. L'LLM sottoposto a fine-tuning concentra quindi la sua potenza sul 20% dei casi più impegnativi, aumentando la precisione di rilevamento di 3,7 volte e la recall di 1,5 volte. Decine di milioni di messaggi vengono elaborati ogni anno, garantendo che le conversazioni rimangano sicure, mantenendo al contempo interazioni oneste ed evitando costi superflui.

Sviluppo su Databricks: sicuro, standardizzato e flessibile

Tutti i flussi di lavoro avanzati di IA e di fiducia in Thumbtack ora vengono eseguiti tramite una piattaforma di ML unificata basata su Databricks. Gli investimenti chiave e le misure di salvaguardia includono:

  • Gestione centralizzata dei carichi di lavoro LLM: eseguendo tutti i carichi di lavoro GenAI su Databricks, riduciamo la nostra superficie di attacco e manteniamo un modello di governance coerente.
  • Isolamento del Workspace: i cloud privati virtuali garantiscono la protezione dei dati sensibili, con autorizzazioni granulari gestite tramite strumenti come Terraform. Utilizziamo Unity Catalog per abilitare il serverless e Databricks Genie per accedere a BigQuery, come parte del modo in cui garantiamo una gestione sicura delle autorizzazioni.
  • Protezione automatizzata della privacy: gli scrubber open source e sviluppati internamente rimuovono le informazioni di identificazione personale (PII) e le informazioni riservate dai dati mentre fluiscono attraverso notebook, modelli e pipeline.
  • Osservabilità e monitoraggio completi: ogni modello, notebook e route API viene monitorato per il data drift e l'esposizione di PII. Gli strumenti di visualizzazione confermano che i dati a rischio non trapelano nei sistemi downstream.
  • Gestione centralizzata di segreti e artefatti: con MLflow e i gestori di segreti, i team gestiscono le credenziali in modo sicuro, versionano tutti i modelli e collaborano in modo produttivo, senza più dover copiare e incollare chiavi o librerie in modo decentralizzato e fragile.

Best practice nelle attività operative GenAI

  • Carichi di lavoro IA ibridi: i servizi di produzione vengono eseguiti su AWS con le analitiche su Google Cloud, ma tutti i flussi di lavoro GenAI sono centralizzati e standardizzati per la riproducibilità.
  • Riutilizzo ed efficienza: il tracciamento di MLflow e dei Notebook significa che Experiment o soluzioni possono essere condivisi, confrontati ed estesi tra i team di ingegneria, SRE e analitiche, il tutto con controlli della privacy coerenti.
  • Protezioni proattive per la privacy: Thumbtack personalizza gli scrubber PII open source in base alle sue esigenze specifiche e applica il monitoraggio a ogni livello. Le tendenze del settore indicano che le violazioni di Notebook e modelli relative a PII sono aumentate del 300% dal 2022, rendendo queste protezioni di importanza critica per l'azienda.

Più sicurezza, più fiducia, più innovazione

  • Scalabilità del marketplace: milioni di utenti statunitensi e oltre 300.000 aziende di servizi locali ora interagiscono all'interno di una piattaforma che dà priorità a sicurezza e affidabilità.
  • Filtro dei messaggi superiore: Precisione aumentata di 3,7x, recall aumentato di 1,5x, costi controllati elaborando solo il 20% dei messaggi più a rischio con gli LLM e salvaguardando la privacy in ogni fase.
  • Collaborazione ed efficienza: i flussi di lavoro ML centralizzati e riproducibili eliminano i passaggi manuali e consentono una rapida innovazione tra team, permettendo a data scientist, SRE e ingegneri di ML di lavorare in sincronia.
  • Sicurezza su Scale: grazie a solidi controlli tecnici e di processo, Thumbtack realizza la sua missione di essere il marketplace più affidabile e trasparente per i servizi per la casa.

Mentre Thumbtack prosegue il suo percorso con la GenAI, ogni team ha la possibilità di sperimentare, collaborare e offrire esperienze di servizi per la casa più sicure e intelligenti. La strategia si basa sull'impatto nel mondo reale, dimostrando come l'IA, la privacy e l'approccio basato sulla piattaforma si combinino per creare valore sia per i professionisti che per i proprietari di casa.

Guarda la presentazione di Thumbtack Boosting Data Science and AI Productivity With Databricks Notebooks al Data + AI Summit 2025.

 

(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale

Non perdere mai un post di Databricks

Iscriviti al nostro blog e ricevi gli ultimi post direttamente nella tua casella di posta elettronica.

Cosa succederà adesso?

how 7 eleven inc bilt a game changing genai creative assistant for marketing with mosaic ai in og image

Líder de dados

October 16, 2025/8 min de leitura

Como a 7-Eleven, Inc. Criação de um assistente criativo de GenAI revolucionário para marketing com o Mosaic AI

Supercharging AI Model Building: Data and Task Parallelism with Ray and Databricks

Líder de dados

November 6, 2025/8 min de leitura

Potencializando a criação de modelos de AI: paralelismo de dados e de tarefa com Ray e Databricks