La misión de Thumbtack es simple pero ambiciosa: empoderar a las personas para que gestionen sus hogares con confianza y sin esfuerzo, haciendo que cada servicio, reparación y mejora sea confiable y seguro. Apoyamos las economías locales conectando a millones de propietarios de viviendas en todo el país con más de 300,000 profesionales calificados, desde plomeros y electricistas hasta proveedores de bienestar y organizadores de eventos. La oportunidad es enorme, pero también lo es la complejidad; nuestro objetivo es garantizar resultados consistentes y excepcionales para cada cliente, en todo momento.
La rápida evolución de los servicios para el hogar y las crecientes expectativas de los clientes significan que estamos mejorando continuamente nuestra plataforma: los volúmenes de datos, las necesidades impredecibles de los clientes y profesionales, y la expansión de las categorías de servicios presentan desafíos técnicos y organizativos. Thumbtack se enfrentaba a flujos de trabajo de ciencia de datos e ingeniería fragmentados, una infraestructura aislada y un alto estándar de privacidad y seguridad.
Resolver estos desafíos requirió más que algoritmos inteligentes o una infraestructura más rápida. Se requirió una plataforma de datos y machine learning conectada y confiable que ponga la seguridad, la privacidad y la colaboración en el centro. Nuestro enfoque: unificar nuestro ecosistema de GenAI sobre Databricks para generar un impacto real y medible.
El pipeline semiautomatizado de revisión de mensajes de Thumbtack es la columna vertebral de nuestra plataforma de confianza digital. Cada mensaje, entre un cliente y un profesional, es analizado tanto por un motor basado en reglas como por un modelo de machine learning. Si bien los casos típicos de abuso se pueden detectar con reglas simples, muchas violaciones de políticas con matices no. Los primeros sistemas basados en redes neuronales convolucionales (CNN) tenían dificultades para diferenciar entre el sarcasmo, el contexto o las amenazas implícitas.
El ajuste fino de los grandes modelos de lenguaje con los datos etiquetados propios de Thumbtack marcó una diferencia radical. Con nuestro flujo de trabajo híbrido, un modelo CNN prefiltra los mensajes que son obviamente buenos, lo que reduce la carga de trabajo del LLM en un 80 %. El LLM con ajuste fino centra su poder en el 20 % más desafiante, lo que aumenta la precisión de la detección en 3.7 veces y la recuperación (recall) en 1.5 veces. Cada año se procesan decenas de millones de mensajes, lo que garantiza que las conversaciones sigan siendo seguras, al tiempo que se mantienen interacciones honestas y se evitan costos innecesarios.
Todos los flujos de trabajo avanzados de IA y confianza en Thumbtack ahora se ejecutan a través de una plataforma de ML unificada basada en Databricks. Las inversiones y salvaguardias clave incluyen:
A medida que Thumbtack continúa su viaje con la GenAI, cada equipo tiene la capacidad de experimentar, colaborar y ofrecer experiencias de servicio a domicilio más seguras e inteligentes. La estrategia se basa en el impacto en el mundo real, lo que demuestra cómo la IA, la privacidad y el pensamiento de plataforma se combinan para crear valor tanto para los profesionales como para los propietarios de viviendas.
Vea la presentación de Thumbtack Boosting Data Science and AI Productivity With Databricks Notebooks del Data + AI Summit 2025.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Líder de dados
October 16, 2025/8 min de leitura
Líder de dados
November 6, 2025/8 min de leitura


