La missione di Thumbtack è semplice ma ambiziosa: consentire alle persone di gestire le proprie case con sicurezza e senza sforzo, rendendo ogni servizio, riparazione e miglioria affidabile e sicuro. Sosteniamo le economie locali mettendo in contatto milioni di proprietari di case in tutto il paese con oltre 300.000 professionisti qualificati, da idraulici ed elettricisti a fornitori di servizi per il benessere e organizzatori di eventi. L'opportunità è enorme, ma lo è anche la complessità: il nostro obiettivo è garantire risultati costanti ed eccezionali per ogni cliente, ogni volta.
La rapida evoluzione dei servizi per la casa e le crescenti aspettative dei clienti ci impongono di migliorare continuamente la nostra piattaforma: volumi di dati, esigenze imprevedibili di clienti e professionisti e categorie di servizi in espansione presentano sfide tecniche e organizzative. Thumbtack ha dovuto affrontare flussi di lavoro di Data Science e ingegneria frammentati, un'infrastruttura a silos e standard elevati per la privacy e la sicurezza.
Risolvere queste sfide ha richiesto più che algoritmi intelligenti o un'infrastruttura più veloce. Ha richiesto una piattaforma dati e di machine learning connessa e affidabile che mettesse al centro la sicurezza, la privacy e la collaborazione. Il nostro approccio: unificare il nostro ecosistema GenAI su Databricks per generare un impatto reale e misurabile.
La pipeline semi-automatizzata di revisione dei messaggi di Thumbtack è la spina dorsale della nostra piattaforma di fiducia digitale. Ogni messaggio, tra un cliente e un professionista, viene esaminato sia da un motore basato su regole sia da un modello di machine learning. Mentre i casi di abuso tipici possono essere individuati con regole semplici, molte violazioni delle policy più complesse non possono esserlo. I primi sistemi basati su reti neurali convoluzionali (CNN) avevano difficoltà a distinguere tra sarcasmo, contesto o minacce implicite.
Il fine-tuning di modelli linguistici di grandi dimensioni sui dati etichettati di Thumbtack ha prodotto un cambiamento radicale. Con il nostro flusso di lavoro ibrido, un modello CNN pre-filtra i messaggi chiaramente validi, riducendo il carico di lavoro dell'LLM dell'80%. L'LLM sottoposto a fine-tuning concentra quindi la sua potenza sul 20% dei casi più impegnativi, aumentando la precisione di rilevamento di 3,7 volte e la recall di 1,5 volte. Decine di milioni di messaggi vengono elaborati ogni anno, garantendo che le conversazioni rimangano sicure, mantenendo al contempo interazioni oneste ed evitando costi superflui.
Tutti i flussi di lavoro avanzati di IA e di fiducia in Thumbtack ora vengono eseguiti tramite una piattaforma di ML unificata basata su Databricks. Gli investimenti chiave e le misure di salvaguardia includono:
Mentre Thumbtack prosegue il suo percorso con la GenAI, ogni team ha la possibilità di sperimentare, collaborare e offrire esperienze di servizi per la casa più sicure e intelligenti. La strategia si basa sull'impatto nel mondo reale, dimostrando come l'IA, la privacy e l'approccio basato sulla piattaforma si combinino per creare valore sia per i professionisti che per i proprietari di casa.
Guarda la presentazione di Thumbtack Boosting Data Science and AI Productivity With Databricks Notebooks al Data + AI Summit 2025.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Líder de dados
October 16, 2025/8 min de leitura
Líder de dados
November 6, 2025/8 min de leitura


