Ir al contenido principal

Thumbtack potencia servicios para el hogar seguros e inteligentes en Databricks con GenAI

Descubre cómo Thumbtack aprovecha los modelos de lenguaje grandes ajustados, una plataforma de ML unificada y Databricks para aumentar la confianza, la seguridad y la productividad de millones de propietarios y profesionales.

Thumbtack Powering Safe, Smart Home Services on Databricks with GenAI

Published: January 9, 2026

Líder de datos5 min read

Summary

  • Thumbtack conecta a millones de propietarios de viviendas de EE. UU. y a más de 300,000 empresas de servicios locales, combinando GenAI y Databricks en Google Cloud para ofrecer experiencias de servicio a domicilio rápidas y confiables.
  • La precisión en la revisión de mensajes aumentó 3.7 veces, con un recall 1.5 veces mayor, ya que los LLM perfeccionados y los flujos de trabajo que priorizan la privacidad impulsan la confianza y la seguridad escalables.
  • MLflow centralizado y los notebooks estandarizados permiten una colaboración segura y productiva, lo que acelera el valor para el cliente en todas las funciones del negocio.

Construyendo la plataforma de cuidado del hogar más confiable

La misión de Thumbtack es simple pero ambiciosa: empoderar a las personas para que gestionen sus hogares con confianza y sin esfuerzo, haciendo que cada servicio, reparación y mejora sea confiable y seguro. Apoyamos las economías locales conectando a millones de propietarios de viviendas en todo el país con más de 300,000 profesionales calificados, desde plomeros y electricistas hasta proveedores de bienestar y organizadores de eventos. La oportunidad es enorme, pero también lo es la complejidad; nuestro objetivo es garantizar resultados consistentes y excepcionales para cada cliente, en todo momento.

Desbloqueando el valor de la GenAI en Thumbtack

La rápida evolución de los servicios para el hogar y las crecientes expectativas de los clientes significan que estamos mejorando continuamente nuestra plataforma: los volúmenes de datos, las necesidades impredecibles de los clientes y profesionales, y la expansión de las categorías de servicios presentan desafíos técnicos y organizativos. Thumbtack se enfrentaba a flujos de trabajo de ciencia de datos e ingeniería fragmentados, una infraestructura aislada y un alto estándar de privacidad y seguridad.

Resolver estos desafíos requirió más que algoritmos inteligentes o una infraestructura más rápida. Se requirió una plataforma de datos y machine learning conectada y confiable que ponga la seguridad, la privacidad y la colaboración en el centro. Nuestro enfoque: unificar nuestro ecosistema de GenAI sobre Databricks para generar un impacto real y medible.

GenAI confiable, seguridad centralizada y ciencia de datos productiva

Mejorando la confianza y la seguridad con LLM ajustados

El pipeline semiautomatizado de revisión de mensajes de Thumbtack es la columna vertebral de nuestra plataforma de confianza digital. Cada mensaje, entre un cliente y un profesional, es analizado tanto por un motor basado en reglas como por un modelo de machine learning. Si bien los casos típicos de abuso se pueden detectar con reglas simples, muchas violaciones de políticas con matices no. Los primeros sistemas basados en redes neuronales convolucionales (CNN) tenían dificultades para diferenciar entre el sarcasmo, el contexto o las amenazas implícitas.

El ajuste fino de los grandes modelos de lenguaje con los datos etiquetados propios de Thumbtack marcó una diferencia radical. Con nuestro flujo de trabajo híbrido, un modelo CNN prefiltra los mensajes que son obviamente buenos, lo que reduce la carga de trabajo del LLM en un 80 %. El LLM con ajuste fino centra su poder en el 20 % más desafiante, lo que aumenta la precisión de la detección en 3.7 veces y la recuperación (recall) en 1.5 veces. Cada año se procesan decenas de millones de mensajes, lo que garantiza que las conversaciones sigan siendo seguras, al tiempo que se mantienen interacciones honestas y se evitan costos innecesarios.

Desarrollo sobre Databricks: seguro, estandarizado y flexible

Todos los flujos de trabajo avanzados de IA y confianza en Thumbtack ahora se ejecutan a través de una plataforma de ML unificada basada en Databricks. Las inversiones y salvaguardias clave incluyen:

  • Gestión centralizada de la carga de trabajo de LLM: al ejecutar todas las cargas de trabajo de GenAI en Databricks, reducimos nuestra superficie de ataque y mantenemos un modelo de gobernanza coherente.
  • Aislamiento del espacio de trabajo: las nubes privadas virtuales garantizan que los datos confidenciales permanezcan protegidos, con permisos granulares administrados a través de herramientas como Terraform. Usamos Unity Catalog para habilitar la tecnología sin servidor y Databricks Genie para acceder a BigQuery, como parte de la forma en que garantizamos una gestión segura de los permisos.
  • Protección de la privacidad automatizada: los depuradores de código abierto y de desarrollo interno eliminan la información de identificación personal (PII) y la información confidencial de los datos a medida que fluyen por los notebooks, los modelos y las canalizaciones.
  • Observabilidad y monitoreo integrales: cada modelo, notebook y ruta de API se monitorea para detectar el desvío de datos y la exposición de PII. Las herramientas de visualización confirman que los datos de riesgo no se filtran en los sistemas posteriores.
  • Gestión centralizada de secretos y artefactos: con MLflow y los administradores de secretos, los equipos gestionan las credenciales de forma segura, versionan todos los modelos y colaboran de forma productiva; se acabó el copiar y pegar claves o bibliotecas de forma descentralizada y frágil.

Mejores prácticas en las operaciones de GenAI

  • Cargas de trabajo de IA híbridas: los servicios de producción se ejecutan en AWS con análisis en Google Cloud, pero todos los flujos de trabajo de GenAI están centralizados y estandarizados para la reproducibilidad.
  • Reutilización y eficiencia: MLflow y el seguimiento de notebooks significan que los experimentos o las soluciones se pueden compartir, comparar y ampliar en los campos de la ingeniería, SRE y análisis, todo con controles de privacidad coherentes.
  • Medidas de protección de la privacidad proactivas: Thumbtack personaliza los depuradores de PII de código abierto para sus necesidades específicas y aplica la supervisión en cada capa. Las tendencias del sector indican que las violaciones de seguridad en los notebooks y modelos relacionadas con la PII han aumentado un 300 % desde 2022, lo que hace que estas protecciones sean fundamentales para el negocio.

Más seguridad, más confianza, más innovación

  • Escala del marketplace: millones de usuarios de EE. UU. y más de 300,000 empresas de servicios locales ahora interactúan dentro de una plataforma que prioriza la seguridad y la confiabilidad.
  • Filtrado superior de mensajes: precisión 3.7 veces mayor, recall 1.5 veces mayor, costos controlados al procesar solo el 20 % de los mensajes más riesgosos con LLM y, al mismo tiempo, salvaguardando la privacidad en cada paso.
  • Colaboración y eficiencia: Los flujos de trabajo de ML centralizados y reproducibles eliminan las transferencias manuales y permiten una rápida innovación entre equipos, lo que permite que los científicos de datos, los SRE y los ingenieros de ML trabajen en sincronía.
  • Confianza a escala: con controles técnicos y de procesos sólidos, Thumbtack cumple su misión de ser el marketplace más confiable y transparente para los servicios del hogar.

A medida que Thumbtack continúa su viaje con la GenAI, cada equipo tiene la capacidad de experimentar, colaborar y ofrecer experiencias de servicio a domicilio más seguras e inteligentes. La estrategia se basa en el impacto en el mundo real, lo que demuestra cómo la IA, la privacidad y el pensamiento de plataforma se combinan para crear valor tanto para los profesionales como para los propietarios de viviendas.

Vea la presentación de Thumbtack Boosting Data Science and AI Productivity With Databricks Notebooks del Data + AI Summit 2025.

 

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.

¿Qué sigue?

how 7 eleven inc bilt a game changing genai creative assistant for marketing with mosaic ai in og image

Líder de dados

October 16, 2025/8 min de leitura

Como a 7-Eleven, Inc. Criação de um assistente criativo de GenAI revolucionário para marketing com o Mosaic AI

Supercharging AI Model Building: Data and Task Parallelism with Ray and Databricks

Líder de dados

November 6, 2025/8 min de leitura

Potencializando a criação de modelos de AI: paralelismo de dados e de tarefa com Ray e Databricks