Apresentando Agent Bricks: Agentes Auto-Otimizados Usando Seus Dados

Publicado: 11 de junho de 2025

Anúncios8 min de leitura

por Xiangrui Meng, Kasey Uhlenhuth, Hanlin Tang, Patrick Wendell e Matei Zaharia

Summary

Agentes auto-otimizados: Construa agentes de alta qualidade e específicos para o domínio, descrevendo a tarefa - Agent Bricks cuida da avaliação e do ajuste.
Resultados rápidos e eficientes em termos de custo: Alcance maior qualidade com menor custo com otimização automatizada alimentada pela pesquisa Mosaic AI.
Confiável em produção: Usado por Flo Health, AstraZeneca e mais para escalar IA segura e precisa em dias, não semanas.

No ano passado, a promessa da inteligência de dados - construir IA que pode raciocinar sobre seus dados - chegou com o Mosaic AI, uma plataforma abrangente para construir, avaliar, monitorar e proteger sistemas de IA. Desde então, milhares de nossos clientes enviaram inteligência de dados para produção, construindo agentes específicos do domínio alimentados por seus dados empresariais:

Mastercard enviou assistentes digitais para acelerar o processo de integração do cliente
A AT&T protege clientes de telefonia móvel contra fraudes e danos
A Crisis Text Line construiu agentes de IA especializados em saúde mental para treinar a próxima geração de conselheiros de crise
Block enviou goose, um assistente de codificação AI baseado no contexto empresarial

No entanto, a imaturidade da tecnologia gerativa significava que a jornada para a produção ainda era desafiadora. Construir agentes de alta qualidade era frequentemente muito complexo, por várias razões:

A avaliação é difícil: Muitas tarefas de IA empresarial são difíceis de avaliar, tanto para humanos quanto para juízes LLM automatizados. Benchmarks acadêmicos como exames de matemática não se traduziram em casos de uso do mundo real. Construir avaliações matizadas muitas vezes exigia rotulagem manual cara. Como resultado, projetos promissores estagnaram em ciclos intermináveis de ajustes, com as partes interessadas perdendo a confiança devido ao progresso incerto.
Muitos ajustes: Os agentes são sistemas complexos de IA com muitos componentes, cada um com seus próprios ajustes. Desde a sintonização de prompts até estratégias de indexação de blocos, escolhas de modelos e parâmetros de ajuste fino, cada ajuste cria efeitos desconhecidos em todo o sistema. O que deveria ser uma melhoria iterativa rápida se torna um caro e tedioso processo manual de tentativa e erro, retardando o tempo de produção.
Custo e qualidade: Mesmo depois que as equipes resolvem os problemas acima e constroem um agente de alta qualidade, muitas vezes se surpreendem ao descobrir que o agente é muito caro para escalar na produção. Assim, as equipes ficam paralisadas em um longo processo de otimização de custos, ou são forçadas a fazer concessões entre custo e qualidade.

Agent Bricks: Agentes auto-otimizadores para suas tarefas de domínio

Com base em nossas experiências anteriores trabalhando com clientes para implementar IA em produção, passamos o último ano repensando como construir agentes. Hoje, estamos apresentando o Agent Bricks, um novo produto que muda a forma como as empresas desenvolvem agentes específicos para cada domínio. Em vez de gerenciar a complexidade avassaladora do desenvolvimento de agentes, as equipes podem se concentrar no que mais importa: definir o propósito de seu agente e fornecer orientação estratégica sobre a qualidade por meio de feedback em linguagem natural. O Agent Bricks cuida do resto, gerando automaticamente conjuntos de avaliação e otimizando a qualidade automaticamente.

Agent Bricks

Veja como funciona:

Declare sua tarefa. Selecione sua tarefa, defina em linguagem natural uma descrição de alto nível do que você deseja que o agente realize e conecte suas fontes de dados.
Avaliação automática: O Agente Bricks irá então criar automaticamente benchmarks de avaliação específicos para a sua tarefa, que podem envolver a geração sintética de novos dados ou a construção de juízes LLM personalizados.

Powered by MLflow 3, Agent Bricks automatically creates evaluation datasets and custom judges tailored to your task.
Otimização Automática: Agent Bricks busca e combina inteligentemente várias técnicas de otimização, como engenharia de prompt, aprimoramento de modelo, modelos de recompensa ou otimização adaptativa ao teste (TAO) para alcançar alta qualidade.
Custo e qualidade: Agent Bricks garante que os agentes sejam não apenas altamente eficazes, mas também custo-efetivos. Os usuários podem escolher entre modelos otimizados para custo ou qualidade. Em muitos casos, a solução final é de maior qualidade e menor custo em comparação com outras abordagens DIY.

Com o Agente Bricks, elimine suposições através de avaliações automáticas. Nós otimizamos automaticamente os ajustes, para que você possa confiar no desempenho do seu agente e saber que está operando com a máxima eficiência. O resultado final é que agora você pode enviar agentes de alta qualidade e custo eficiente para produção. O Agente Bricks é otimizado para casos de uso comuns da indústria, incluindo extração de informações estruturadas, assistência de conhecimento confiável, transformação de texto personalizado e sistemas multi-agentes orquestrados.

Construa agentes de alta qualidade com Agent Bricks

O Agent Bricks é singularmente capaz de medir, construir e melhorar continuamente a qualidade. Com a construção de agentes conversacionais sobre documentos, por exemplo, medimos a qualidade média em vários benchmarks de perguntas e respostas. Comparado a outros produtos nesta área, o Agent Bricks construiu agentes de qualidade significativamente superior (Figura 1). Não só isso, com a capacidade de aprendizado contínuo, o desempenho continua a melhorar ao longo do tempo.

O Agent Bricks construiu agentes de qualidade significativamente superior — Figure 1

Para a compreensão de documentos, o Agent Bricks constrói sistemas de maior qualidade e menor custo, em comparação com os LLMs proprietários otimizados por prompts (Figura 2). Podemos alcançar um sistema de maior qualidade em um benchmark de análise de documentos, mas com um custo até 10 vezes menor.

O Agente Bricks constrói sistemas de maior qualidade e menor custo, comparado a LLMs proprietários otimizados por prompt — Figure 2

Além desses benchmarks, nossos clientes também conseguem construir agentes de qualidade com o Agent Bricks:

Alimentado pela mais recente pesquisa em aprendizado de agentes

Agent Bricks é capaz de alcançar esses resultados porque é alimentado pela pesquisa proveniente de nossa equipe de pesquisa em IA Mosaic da Databricks. Há um zoológico de métodos para melhorar a qualidade do agente, e novas pesquisas são lançadas em um ritmo vertiginoso. Nossa equipe tanto cura pesquisas existentes quanto desenvolve novas inovações que são então usadas pelo Agente Bricks durante a fase de avaliação e otimização automática. Embora tenhamos um conjunto expansivo de métodos, hoje estamos animados para destacar uma de nossas inovações - Aprendizado de Agente a partir de Feedback Humano (ALHF).

Aprendizado de Agente a partir de Feedback Humano (ALHF)

Um desafio chave para a qualidade é a capacidade de direcionar o comportamento do agente a partir do feedback. Isso é particularmente difícil porque o feedback geralmente é fornecido apenas com um sinal de positivo ou negativo, e não está claro quais dos muitos componentes e ajustes dentro de um sistema de agente precisam ser ajustados para respeitar o feedback. A abordagem atual, que é colocar todas as instruções em um único prompt LLM massivo, é frágil e não se generaliza para um sistema de agente mais complexo.

Com o ALHF, resolvemos isso com duas abordagens. Primeiro, somos capazes de receber o rico contexto da orientação em linguagem natural (por exemplo, ignore todos os dados antes de maio de 1990). Segundo, com base nesta orientação em linguagem natural, nossos algoritmos traduzem inteligentemente a orientação em otimizações técnicas - refinando o algoritmo de recuperação, aprimorando prompts, filtrando o banco de dados de vetores, ou até mesmo modificando o padrão agente.

Esta abordagem democratiza o desenvolvimento de agentes, permitindo que especialistas do domínio contribuam diretamente para a melhoria do sistema sem uma profunda expertise técnica em infraestrutura de IA.

Aprendizado de Agente a partir de Feedback Humano (ALHF)

O Caminho a Seguir: Do Laboratório à Produção em Dias, Não Meses

Os primeiros clientes já estão experimentando a transformação que o Agente Bricks proporciona - melhorias de precisão que dobram os benchmarks de desempenho e reduzem os prazos de desenvolvimento de semanas para um único dia. Mais importante, eles estão alcançando algo que parecia impossível há apenas alguns meses: sistemas de IA sustentáveis e escaláveis que proporcionam valor comercial consistente.

Agent Bricks representa mais do que uma evolução nas ferramentas - é uma mudança fundamental em direção ao desenvolvimento de IA madura e pronta para produção. À medida que os sistemas de agentes se tornam cada vez mais centrais para as operações empresariais, as abordagens de "verificação de vibe" do passado simplesmente não vão escalar. As organizações precisam de uma abordagem robusta e sistemática para construir e otimizar agentes inteligentes que possam lidar com a complexidade e os requisitos das aplicações de negócios do mundo real.

Clientes usando Agent Bricks

Muitos clientes da Databricks já construíram Agentes de IA com o Agent Bricks, e todos estamos ansiosos para ver o que eles podem fazer no futuro.

Assista o vídeo com Experian e Flo Health

Experimente o Agent Bricks Hoje

Pronto para diminuir a diferença entre "qualidade de demonstração" e "qualidade de produção"? Agent Bricks agora está disponível em beta.

Introdução

Leia a documentação
Assista a palestra principal
Assista clientes descrevendo os benefícios de usar o Agent Bricks

O futuro da IA empresarial não é sobre gerenciar a complexidade - é sobre focar nos resultados que importam enquanto o Agent Bricks cuida do resto.

(This blog post has been translated using AI-powered tools) Original Post

O que vem a seguir?

Introducing AI/BI: Intelligent Analytics for Real-World Data

12 de junho de 2024/11 min de leitura

Apresentando o AI/BI: analítica inteligente para dados do mundo real

7 de janeiro de 2025/8 min de leitura

Apresentando Agent Bricks: Agentes Auto-Otimizados Usando Seus Dados

Summary

Agent Bricks: Agentes auto-otimizadores para suas tarefas de domínio

Construa agentes de alta qualidade com Agent Bricks

Alimentado pela mais recente pesquisa em aprendizado de agentes

O Caminho a Seguir: Do Laboratório à Produção em Dias, Não Meses

Clientes usando Agent Bricks

Experimente o Agent Bricks Hoje

Anunciando Endpoints Otimizados para Armazenamento para Pesquisa de Vetores

O que vem a seguir?

Apresentando o AI/BI: analítica inteligente para dados do mundo real

Databricks na Databricks - Transformando a Experiência de Vendas usando Agentes GenAI

Summary

Agent Bricks: Agentes auto-otimizadores para suas tarefas de domínio

Construa agentes de alta qualidade com Agent Bricks

Alimentado pela mais recente pesquisa em aprendizado de agentes

Gartner®: Databricks, líder em banco de dados em nuvem

O Caminho a Seguir: Do Laboratório à Produção em Dias, Não Meses

Clientes usando Agent Bricks

Experimente o Agent Bricks Hoje

Anunciando Endpoints Otimizados para Armazenamento para Pesquisa de Vetores

Nunca perca uma postagem da Databricks

Sign up

O que vem a seguir?

Apresentando o AI/BI: analítica inteligente para dados do mundo real

Databricks na Databricks - Transformando a Experiência de Vendas usando Agentes GenAI