Ir para o conteúdo principal

Thumbtack impulsionando serviços domésticos seguros e inteligentes no Databricks com IA generativa

Descubra como a Thumbtack utiliza modelos de linguagem grandes ajustados, uma plataforma de ML unificada e o Databricks para aumentar a confiança, a segurança e a produtividade para milhões de proprietários e profissionais.

Thumbtack Powering Safe, Smart Home Services on Databricks with GenAI

Published: January 9, 2026

Líder de dados5 min read

Summary

  • A Thumbtack conecta milhões de proprietários de residências nos EUA e mais de 300.000 empresas de serviços locais, combinando GenAI e o Databricks on Google Cloud para oferecer experiências de serviço doméstico rápidas e confiáveis.
  • A precisão na revisão de mensagens aumentou 3,7x, com o recall aumentando 1,5x, à medida que os LLMs com ajuste fino e os fluxos de trabalho que priorizam a privacidade impulsionam a confiança e a segurança escaláveis.
  • O MLflow centralizado e os notebooks padronizados permitem uma colaboração segura e produtiva, acelerando o valor para o cliente em todas as funções de negócios.

Construindo a plataforma de serviços domésticos mais confiável

A missão da Thumbtack é simples, mas ambiciosa: empoderar as pessoas para que gerenciem suas casas com confiança e sem esforço, tornando cada serviço, reparo e melhoria confiável e seguro. Apoiamos as economias locais conectando milhões de proprietários de residências em todo o país a mais de 300.000 profissionais qualificados, de encanadores e eletricistas a provedores de bem-estar e organizadores de eventos. A oportunidade é vasta, mas a complexidade também — nosso objetivo é garantir resultados consistentes e excepcionais para cada cliente, sempre.

Liberando o valor da GenAI na Thumbtack

A rápida evolução dos serviços domésticos e as crescentes expectativas dos clientes significam que estamos continuamente aprimorando nossa plataforma — volumes de dados, necessidades imprevisíveis de clientes e profissionais e a expansão das categorias de serviço apresentam desafios técnicos e organizacionais. A Thumbtack enfrentava fluxos de trabalho de ciência de dados e engenharia fragmentados, infraestrutura isolada e um alto padrão de privacidade e segurança.

Resolver esses desafios exigiu mais do que algoritmos inteligentes ou uma infraestrutura mais rápida. Exigiu uma plataforma de dados e machine learning conectada e confiável que coloca a segurança, a privacidade e a colaboração em seu centro. Nossa abordagem: unificar nosso ecossistema de GenAI na plataforma Databricks para gerar um impacto real e mensurável.

GenAI confiável, segurança centralizada e ciência de dados produtiva

Aumentando a confiança e a segurança com LLMs ajustados

O pipeline semiautomatizado de revisão de mensagens da Thumbtack é a espinha dorsal da nossa plataforma de confiança digital. Cada mensagem, entre um cliente e um profissional, é analisada tanto por um mecanismo baseado em regras quanto por um modelo do machine learning. Embora os casos típicos de abuso possam ser detectados com regras simples, muitas violações de políticas com nuances não podem. Os primeiros sistemas baseados em Redes Neurais Convolucionais (CNNs) tinham dificuldade em diferenciar entre sarcasmo, contexto ou ameaças implícitas.

O ajuste fino de modelos de linguagem grandes nos dados com rótulos da própria Thumbtack fez uma diferença transformadora. Com nosso fluxo de trabalho híbrido, um modelo CNN pré-filtra mensagens obviamente boas, reduzindo a carga de trabalho do LLM em 80%. O LLM com ajuste fino concentra seu poder nos 20% mais desafiadores, aumentando a precisão da detecção em 3,7 vezes e o recall em 1,5 vezes. Dezenas de milhões de mensagens são processadas a cada ano, garantindo que as conversas permaneçam seguras, mantendo interações honestas e evitando custos desnecessários.

Desenvolvendo no Databricks: seguro, padronizado e flexível

Todos os fluxos de trabalho avançados de AI e confiança na Thumbtack agora são executados em uma plataforma de ML unificada construída no Databricks. Os key investimentos e salvaguardas incluem:

  • Gerenciamento centralizado de cargas de trabalho de LLM: ao executar todas as cargas de trabalho de GenAI no Databricks, reduzimos nossa superfície de ataque e mantemos um modelo de governança consistente.
  • Isolamento do workspace: nuvens privadas virtuais garantem que os dados sensíveis permaneçam protegidos, com permissões granulares gerenciadas por meio de ferramentas como o Terraform. Usamos o Unity Catalog para habilitar o serverless e o Databricks Genie para acessar o BigQuery como parte da forma como garantimos o gerenciamento seguro de permissões.
  • Proteção automatizada da privacidade: scrubbers de código aberto e desenvolvidos internamente removem Informações de Identificação Pessoal (PII) e informações confidenciais dos dados à medida que fluem por notebooks, modelos e pipelines.
  • Observabilidade e monitoramento abrangentes: Cada modelo, Notebooks e rota de API é rastreado para drift de dados e exposição de PII. As ferramentas de visualização confirmam que dados de risco não estão vazando para sistemas downstream.
  • Gerenciamento centralizado de segredos e artefatos: com o MLflow e gerenciadores de segredos, as equipes gerenciam credenciais com segurança, versionam todos os modelos e colaboram de forma produtiva — chega de copiar e colar chaves ou bibliotecas de forma descentralizada e frágil.

Melhores práticas em operações de GenAI

  • Cargas de trabalho de IA híbridas: os serviços de produção são executados na AWS com analítica no Google Cloud, mas todos os fluxos de trabalho de GenAI são centralizados e padronizados para reprodutibilidade.
  • Reutilização e eficiência: o acompanhamento do MLflow e de notebooks significa que experimentos ou soluções podem ser compartilhados, comparados e estendidos entre as equipes de engenharia, SRE e analítica — tudo com controles de privacidade consistentes.
  • Proteções proativas de privacidade: A Thumbtack personaliza limpadores de PII de código aberto para suas necessidades específicas e impõe o monitoramento em todas as camadas. As tendências da indústria indicam que as violações de notebooks e modelos relacionadas a PII aumentaram 300% desde 2022, tornando essas proteções essenciais para os negócios.

Mais segurança, mais confiança, mais inovação

  • Escala do marketplace: milhões de usuários dos EUA e mais de 300.000 empresas de serviços locais agora interagem em uma plataforma que prioriza a segurança e a confiabilidade.
  • Filtragem de mensagens superior: precisão 3,7x maior, recall 1,5x maior, custos controlados pelo processamento de apenas 20% das mensagens mais arriscadas com LLMs, enquanto se protege a privacidade em cada passo.
  • Colaboração e eficiência: Fluxos de trabalho de ML centralizados e reproduzíveis eliminam transferências manuais e permitem a inovação rápida entre equipes, permitindo que cientistas de dados, SREs e engenheiros de ML trabalhem em sincronia.
  • Confiança em escala: com controles técnicos e de processo robustos, a Thumbtack cumpre sua missão de ser o marketplace mais confiável e transparente para serviços domésticos.

À medida que a Thumbtack continua sua jornada com GenAI, cada equipe é capacitada para experimentar, colaborar e entregar experiências de serviços domésticos mais seguras e inteligentes. A estratégia está fundamentada no impacto no mundo real, demonstrando como IA, privacidade и pensamento de plataforma se combinam para criar valor tanto para profissionais quanto para proprietários de residências.

Assista à apresentação da Thumbtack Boosting ciência de dados and AI Productivity With Databricks Notebooks no Data + AI Summit 2025.

 

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada

O que vem a seguir?

how 7 eleven inc bilt a game changing genai creative assistant for marketing with mosaic ai in og image

Líder de dados

October 16, 2025/8 min de leitura

Como a 7-Eleven, Inc. Criação de um assistente criativo de GenAI revolucionário para marketing com o Mosaic AI

Supercharging AI Model Building: Data and Task Parallelism with Ray and Databricks

Líder de dados

November 6, 2025/8 min de leitura

Potencializando a criação de modelos de AI: paralelismo de dados e de tarefa com Ray e Databricks