Use o Genie Code para acelerar todo o ciclo de vida de ML, o AI Runtime para treinar modelos de deep learning em larga escala e o Feature e Model Serving para impulsionar ML em tempo real em escala.
Nunca houve um momento tão dinâmico e empolgante para criar seus próprios modelos e sistemas de IA. Da previsão de demanda e detecção de fraudes a buscas, recomendações, personalização e IA multimodal, o machine learning está impulsionando aplicações críticas em todos os setores.
No Data + AI Summit 2026, temos o prazer de anunciar os seguintes novos recursos na Databricks AI Platform:
Juntos, esses recursos simplificam o caminho da experimentação à produção, permitindo que as organizações criem, implantem e dimensionem aplicações de IA de forma significativamente mais rápida do que nunca.
Vamos dar uma olhada mais de perto nas novidades.
Hoje, levar um modelo de ML para a produção pode levar meses, com as equipes gastando inúmeras horas em tarefas repetitivas ao longo do ciclo de vida de ML — desde a engenharia de atributos e gerenciamento de experimentos até a avaliação e implantação de modelos. Mas os agentes transformaram a forma como as equipes técnicas e de engenharia operam. Para esse fim, no DAIS deste ano, temos o prazer de anunciar o suporte do Genie Code para todo o ciclo de vida de ML.
A criação e a operação de modelos de ML exigem decisões detalhadas que os agentes de codificação genéricos não conseguem tomar. Posso confiar na atualização e na qualidade deste conjunto de dados como um atributo? Esse atributo causará vazamento de dados futuros no modelo? Esse endpoint de serviço está começando a apresentar desvio (drift)? Acertar os detalhes em ML exige um contexto profundo, e esse contexto só vem de uma integração estreita com a plataforma de dados e ML: seus dados e sua qualidade, linhagem de atributos, histórico de experimentos, infraestrutura de treinamento e desempenho em produção.
É aí que entra o Genie Code:
E assim, com o Genie Code, suas equipes de ML podem avançar mais rápido do que nunca.
O Genie Code lida com a engenharia de atributos da mesma forma que seu engenheiro de ML sênior faria — aprendendo os padrões existentes da sua equipe, reutilizando transformações comprovadas e criando atributos consistentes com o que já está em produção.
O Genie Code não apenas escreve código de ML — ele treina e ajusta modelos de nível de produção. Ele seleciona e configura automaticamente a infraestrutura correta, seja CPU para experimentos leves ou GPU para treinamento distribuído, e registra cada execução de forma nativa no MLflow.
O Genie Code leva os modelos do notebook para a produção em um único fluxo — registrando no Unity Catalog, implantando em um endpoint de serviço e mantendo a governança intacta em cada etapa do caminho.
O Genie Code mudou completamente a minha forma de trabalhar. Eu executo mais de 15 threads paralelas direcionadas a diferentes notebooks e ativos todos os dias, e gerenciar tudo isso em várias abas é uma das maiores fontes de atrito no meu fluxo de trabalho. O Genie Code em página inteira com sessões simultâneas me daria um verdadeiro espaço de trabalho para executar tudo em paralelo sem perder o contexto constantemente.—Moritz Schiek, Consultor de Soluções, Bosch
Com o Genie Code, passamos de dados brutos para um fluxo de trabalho de ML governado e pronto para produção em 90 minutos. Como ele entende de forma única os fluxos de trabalho de ML em produção na Databricks, ele nos ajudou a criar tabelas Delta, explorar os dados, treinar e comparar modelos, registrá-los no MLflow e no Unity Catalog e implantar o modelo campeão em um endpoint de serviço, sobrando tempo para otimizar o resultado de negócios mais importante.—Radu Dragusin, Engenheiro Principal, Data & AI, Danfoss
Para saber mais sobre o Genie Code, comece por aqui!
As GPUs impulsionam as cargas de trabalho de IA mais avançadas de hoje — desde previsões e recomendações até modelos de fundação multimodais. Mas as equipes de deep learning enfrentam dificuldades para adquirir e gerenciar a infraestrutura de GPU, configurar ambientes de treinamento distribuídos e resolver gargalos de desempenho. Elas preferem focar na modelagem em vez da infraestrutura.
Em março, lançamos uma prévia do AI Runtime e, hoje, temos o prazer de compartilhar, como parte do Data + AI Summit, que o AI Runtime agora suporta treinamento multinó de alto desempenho. Com o AI Runtime, os usuários da Databricks agora têm:
Com esse lançamento, os clientes da Databricks agora podem aproveitar a mesma plataforma de GPU de nível de pesquisa que nossa própria equipe usou para impulsionar o treinamento de modelos de fundação como o DBRX e o KARL. Hoje, o AI Runtime impulsiona cargas de trabalho de fronteira para centenas de clientes da Databricks — ajudando a levar a IA de última geração da pesquisa para aplicações empresariais em produção.

Conecte GPUs Serverless A10 e H100 ao seu notebook em 2 a 3 cliques. Sem necessidade de gerenciamento de cluster; pague apenas pelo que usar.

Use o Genie Code para ajudar a resolver gargalos de desempenho, experimentar novas arquiteturas ou depurar bugs complexos relacionados à convergência de modelos ou erros enigmáticos de framework.

O AI Runtime é uma plataforma de nível de produção para computação acelerada. Desenvolva seu código de deep learning em notebooks interativos e use todo o poder do Lakeflow para enviar e orquestrar jobs em computação de GPU.
O AI Runtime do Databricks simplificou bastante o processo de treinamento de um modelo personalizado de Text To Formula (TTF). Sem configuração de infraestrutura ou atrasos, foi fácil escolher a computação ideal com base no tamanho do prompt e na geração de tokens de saída. Isso nos permitiu agir rapidamente, manter nossos fluxos de trabalho do Lakehouse e entregar um modelo de alta qualidade com governança total, reduzindo o tempo de configuração, treinamento e implantação do nosso modelo de dias para horas.—Nikhil Sunderraj, Engenheiro Principal de Machine Learning, FactSet Research Systems, Inc.
Para começar a treinar seu próximo modelo em GPUs, consulte nossos exemplos e documentação aqui!
As aplicações de machine learning mais impactantes operam em tempo real: servindo recomendações em milissegundos, interrompendo transações fraudulentas antes que sejam aprovadas e entregando resultados de busca que parecem instantâneos.
Implantar um modelo em produção é um equilíbrio delicado: cada solicitação precisa ser concluída em poucos milissegundos, mesmo durante picos de tráfego — mas seus custos devem permanecer baixos quando o tráfego estiver calmo. Manter esse equilíbrio em escala historicamente tem sido tão difícil quanto criar o próprio modelo. Sob alto QPS, a infraestrutura de serving se torna o gargalo. A latência se torna imprevisível, os custos aumentam e as equipes sobrecarregam seus melhores engenheiros reajustando contagens de réplicas, limites de simultaneidade e limites de autoscaling toda vez que um modelo ou seu tráfego muda.
No Data + AI Summit, estamos anunciando novos recursos que eliminam essa sobrecarga — e simplificam a obtenção de serving de baixa latência e alto QPS no Databricks:
Os clientes que utilizam o Databricks Model Serving reduziram os custos de infraestrutura em até mais de 90% em comparação com pilhas autogerenciadas, melhoraram a latência p99 e p50 em até 2 vezes e escalaram para além de 100 mil QPS em produção com pouca ou nenhuma manutenção, tudo com confiabilidade e disponibilidade de nível empresarial. Equipes líderes de ML, como Grammarly, GoGuardian, e milhares de outros clientes, contam com o Databricks para servir seus sistemas de ML em tempo real.
Para o seu próximo modelo de IA, experimente estes novos recursos! Saiba mais na documentação ou em nossos posts detalhados no blog:
Veja a AI Platform em ação e saiba como organizações líderes estão criando e implantando modelos de IA em escala no Data + AI Summit 2026.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.