A missão da Thumbtack é simples, mas ambiciosa: empoderar as pessoas para que gerenciem suas casas com confiança e sem esforço, tornando cada serviço, reparo e melhoria confiável e seguro. Apoiamos as economias locais conectando milhões de proprietários de residências em todo o país a mais de 300.000 profissionais qualificados, de encanadores e eletricistas a provedores de bem-estar e organizadores de eventos. A oportunidade é vasta, mas a complexidade também — nosso objetivo é garantir resultados consistentes e excepcionais para cada cliente, sempre.
A rápida evolução dos serviços domésticos e as crescentes expectativas dos clientes significam que estamos continuamente aprimorando nossa plataforma — volumes de dados, necessidades imprevisíveis de clientes e profissionais e a expansão das categorias de serviço apresentam desafios técnicos e organizacionais. A Thumbtack enfrentava fluxos de trabalho de ciência de dados e engenharia fragmentados, infraestrutura isolada e um alto padrão de privacidade e segurança.
Resolver esses desafios exigiu mais do que algoritmos inteligentes ou uma infraestrutura mais rápida. Exigiu uma plataforma de dados e machine learning conectada e confiável que coloca a segurança, a privacidade e a colaboração em seu centro. Nossa abordagem: unificar nosso ecossistema de GenAI na plataforma Databricks para gerar um impacto real e mensurável.
O pipeline semiautomatizado de revisão de mensagens da Thumbtack é a espinha dorsal da nossa plataforma de confiança digital. Cada mensagem, entre um cliente e um profissional, é analisada tanto por um mecanismo baseado em regras quanto por um modelo do machine learning. Embora os casos típicos de abuso possam ser detectados com regras simples, muitas violações de políticas com nuances não podem. Os primeiros sistemas baseados em Redes Neurais Convolucionais (CNNs) tinham dificuldade em diferenciar entre sarcasmo, contexto ou ameaças implícitas.
O ajuste fino de modelos de linguagem grandes nos dados com rótulos da própria Thumbtack fez uma diferença transformadora. Com nosso fluxo de trabalho híbrido, um modelo CNN pré-filtra mensagens obviamente boas, reduzindo a carga de trabalho do LLM em 80%. O LLM com ajuste fino concentra seu poder nos 20% mais desafiadores, aumentando a precisão da detecção em 3,7 vezes e o recall em 1,5 vezes. Dezenas de milhões de mensagens são processadas a cada ano, garantindo que as conversas permaneçam seguras, mantendo interações honestas e evitando custos desnecessários.
Todos os fluxos de trabalho avançados de AI e confiança na Thumbtack agora são executados em uma plataforma de ML unificada construída no Databricks. Os key investimentos e salvaguardas incluem:
À medida que a Thumbtack continua sua jornada com GenAI, cada equipe é capacitada para experimentar, colaborar e entregar experiências de serviços domésticos mais seguras e inteligentes. A estratégia está fundamentada no impacto no mundo real, demonstrando como IA, privacidade и pensamento de plataforma se combinam para criar valor tanto para profissionais quanto para proprietários de residências.
Assista à apresentação da Thumbtack Boosting ciência de dados and AI Productivity With Databricks Notebooks no Data + AI Summit 2025.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Líder de dados
October 16, 2025/8 min de leitura
Líder de dados
November 6, 2025/8 min de leitura


