Ir al contenido principal

Presentamos el agente de ciencia de datos Databricks Assistant

De la exploración a los resultados en minutos

Databricks Assistant Data Science Agent

Publicado: 3 de septiembre de 2025

Producto7 min de lectura

Summary

  • El Agente de Ciencia de Datos transforma Databricks Assistant en un socio autónomo para tareas de ciencia de datos y análisis en Notebooks y el Editor SQL.
  • Puede explorar datos, generar y ejecutar código, y corregir errores, todo desde una sola indicación. Esto puede reducir horas de trabajo a minutos.
  • Diseñado específicamente para tareas comunes de ciencia de datos y basado en Unity Catalog para un acceso continuo y gobernado a sus datos.

Desde su lanzamiento hace dos años, el Asistente de Databricks se ha convertido en un socio indispensable para los profesionales de datos, ayudándoles a generar código SQL y Python, resolver errores y recibir orientación contextual directamente en sus flujos de trabajo. Durante ese tiempo, el panorama de la IA ha avanzado rápidamente. La vanguardia ha pasado de simples copilotos y chatbots a agentes que pueden razonar, planificar y ejecutar de forma autónoma procesos complejos de varios pasos. 

Extender este paradigma a los datos requiere más que fluidez en el código. Los agentes de datos empresariales deben ser conscientes del contexto de sus datos, permitirle revisar y refinar su trabajo, y operar con los más altos estándares de gobernanza. Databricks está en una posición única para cumplir esta visión. Con Unity Catalog proporcionando políticas unificadas, linaje y semántica empresarial, la plataforma ya es la base de confianza para la inteligencia de datos. Basándose en esa base, los agentes pueden comprimir el tiempo desde la pregunta hasta la información sin comprometer la transparencia, la confianza o el rigor. Ese es el futuro que ahora estamos aportando al Asistente de Databricks.

Llevando Agentes al Asistente de Databricks

Estamos orgullosos de presentar el Agente de Ciencia de Datos, un avance importante que eleva el Asistente de Databricks de un útil copiloto a un verdadero socio autónomo para la ciencia de datos y el análisis. Completamente integrado con los cuadernos de Databricks y el Editor SQL, el Agente de Ciencia de Datos reúne inteligencia, adaptabilidad y ejecución en una sola experiencia. Es el primero de una nueva generación de agentes de datos de IA disponibles seleccionando el Modo Agente en el Asistente, y comenzará a implementarse para los clientes en los próximos días.

El Agente de Ciencia de Datos se basa en todo lo que ya hace hoy con el Asistente de Databricks y acelera enormemente su trabajo cuando le delega tareas de alto nivel. Aquí hay solo algunas formas en que puede ayudar en su día a día:

  • Exploración de datos: Puede pedirle al agente que “realice un análisis exploratorio de datos en @tabla para identificar patrones interesantes”. Puede proporcionar orientación adicional si desea enfocar la exploración en un área particular. La capacidad “@” es una capacidad existente del Asistente, lo que facilita indicar al Asistente la tabla específica a la que se refiere.
Escriba @ seguido del nombre de su tabla para encontrar rápidamente su conjunto de datos
  • Entrenamiento y evaluación de modelos de ML: El agente puede realizar tareas de aprendizaje automático, utilizando las capacidades de MLflow según sea necesario. Por ejemplo, puede pedirle al agente que “entrene un modelo de pronóstico que prediga las ventas en @tabla_ventas”. Luego puede guiarlo para que utilice tipos de modelos específicos o cuánto enfocarse en la optimización de hiperparámetros.
  • Corrección de errores: A la gente le encanta el botón de diagnóstico de errores del Asistente. En modo agente, la capacidad de diagnóstico de errores puede ayudarle a realizar actualizaciones adicionales e intentar iterativamente la corrección hasta que se resuelva el problema.
  • Resumen y explicación de resultados: Puede pedirle al agente que explique y resuma los resultados de su análisis o que realice análisis adicionales.
  • Búsqueda de datos relevantes: El agente puede ayudarle a encontrar los datos que necesita para completar su tarea en Unity Catalog buscando tablas a las que pueda acceder. Intente describir con detalle lo que está buscando, como los nombres de las columnas o el tipo de datos. El Agente de Ciencia de Datos será más útil para esto si sus tablas y columnas tienen comentarios descriptivos.

Respuestas precisas y confiables

Nuestro objetivo con el Agente de Ciencia de Datos es ofrecer una experiencia de ciencia de datos y análisis en la que pueda confiar, con respuestas precisas, relevantes y basadas en los datos de su organización. Este es un problema difícil, incluso para los modelos de IA de vanguardia, que por sí solos no comprenden la semántica de sus datos, su lógica empresarial o la forma en que trabajan sus equipos. El Agente de Ciencia de Datos cierra esta brecha combinando el poder de razonamiento de los modelos de IA con la Plataforma de Inteligencia de Datos de Databricks, asegurando resultados que son a la vez confiables y conscientes del contexto. Por ejemplo, puede buscar en Unity Catalog para encontrar las tablas y los cuadernos adecuados e interpretar los resultados para sugerir los mejores próximos pasos, como refinar un análisis, entrenar un modelo o resumir los hallazgos para las partes interesadas. Al basar los flujos de trabajo del agente en un contexto gobernado, el Agente de Ciencia de Datos convierte la automatización bruta en una aceleración confiable.

Primeros pasos

Los administradores del espacio de trabajo pueden habilitar la versión beta del modo agente del Asistente desde el portal de vista previa de Databricks

Habilitar el Modo Agente en el portal de vista previa

Una vez que su administrador habilite el modo agente, verá un interruptor en la esquina inferior derecha del Asistente. Cámbielo a Agente, escriba su tarea y deje que el agente la realice de principio a fin. Para solicitudes más complejas o de varios pasos, recomendamos probar Planner para una mayor transparencia y control.

Seleccionar Agente para automatizar análisis y flujos de trabajo de extremo a extremo
LÍDER 5X

Gartner®: Databricks, líder en bases de datos en la nube

Uso de Planner para flujos de trabajo más complejos

La capacidad de Planner del agente le ayuda a manejar flujos de trabajo complejos redactando un plan antes de la ejecución. Actívelo al principio de un hilo del Asistente, y el agente propondrá pasos detallados, haciendo preguntas aclaratorias según sea necesario, y luego refinará el plan según su entrada. Una vez que parezca correcto, haga clic en Continuar, y el agente lo ejecutará paso a paso, revisando los resultados con usted a lo largo del camino y resumiendo los resultados al final.

Usar Planner para flujos de trabajo más complejos

Planner es especialmente valioso cuando la tarea abarca varios pasos o requiere una orquestación cuidadosa. Por ejemplo, en una investigación de abandono, es posible que desee guiar al agente a través de la exploración de datos, el análisis de cohortes y la visualización. O, al crear un pipeline de ML, Planner puede ayudar a estructurar la limpieza de datos, la ingeniería de características, el entrenamiento del modelo y la evaluación en un flujo coherente.

Confirmación de herramientas

Usted permanece al mando. Antes de ejecutar código, el agente solicita su aprobación. Puede elegir:

  • Permitir una vez: aprobar una única ejecución
  • Permitir siempre para este hilo: agilizar el trabajo dentro de la conversación actual del Asistente. Esto se restablece cuando presiona el “+” en la esquina superior derecha del panel del Asistente.
  • Permitir siempre: dar aprobación hasta que cambie la configuración
El agente solicita aprobación

Además, el agente tiene salvaguardas incorporadas para ayudar a reducir acciones no deseadas, como eliminar accidentalmente una tabla. Dicho esto, todavía recomendamos revisar cuidadosamente el código generado, especialmente cuando toca datos de producción, tablas importantes u otras operaciones sensibles.

En el horizonte

Mirando hacia el futuro, estamos invirtiendo en varias mejoras para hacer que el Agente de Ciencia de Datos sea aún más potente:

  • Contexto más amplio: Incorporar contexto adicional a través de la integración de MCP. Esto proporcionará al Asistente nuevos conocimientos que no tiene hoy.
  • Memoria más inteligenteLas instrucciones del Asistente ya son utilizadas por el Agente de Ciencia de Datos, pero queremos que el agente facilite aún más la actualización y curación de sus instrucciones
  • Descubrimiento de datos más rápido: el Agente de Ciencia de Datos puede ayudarte a encontrar los activos que necesitas para tu tarea. Hoy da un primer paso con su capacidad para buscar tablas y código, pero estamos trabajando para mejorar esta área.
  • El Agente de Ciencia de Datos es solo el comienzo. El modo Agente crecerá para orquestar cargas de trabajo completas en Databricks. Estamos construyendo flujos de trabajo de agentes para ingeniería de datos y más allá, todo impulsado por la misma base confiable y gobernada.

    Prueba el Agente de Ciencia de Datos hoy 🚀 

    Consulta nuestra página de producto para obtener más información sobre Databricks Assistant, o lee la documentación para obtener más información sobre todas las funciones.

    Pide a tu administrador que habilite el Modo Agente de Databricks Assistant hoy mismo y comienza a convertir horas de trabajo en minutos. Esto te dará más tiempo para obtener información y menos tiempo para la mecánica.

    (Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

    No te pierdas ninguna publicación de Databricks.

    Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.