Ir para o conteúdo principal

AI and Machine Learning

Accelerate your AI projects with a data-centric approach to machine learning

q5qTlofKQMhSZjLkjXNTqDfb7Zo5CIUlAqwWPc03hP0

Com base em uma arquitetura aberta de lakehouse, a IA e o machine learning na Databricks permitem que as equipes de ML preparem e processem dados, simplifiquem a colaboração em toda a empresa e padronizem todo o ciclo de vida, dos testes à produção, incluindo IA generativa e grandes modelos de linguagem.

Machine Learning

Simplifique todos os aspectos de dados para IA e ML

Desenvolvido em uma base aberta de lakehouse graças ao Delta Lake, o Databricks ML permite que suas equipes de machine learning acessem, explorem e preparem qualquer tipo de dados em qualquer escala. Transforme recursos em pipelines de produção de autoatendimento sem depender do suporte de data engineering.

Machine Learning

Automatize o rastreamento e a governança de experimentos

O MLflow Gerenciado rastreia automaticamente seus parâmetros de experimentos e logs, métricas, controles de versão de dados e código, bem como artefatos de modelo a cada execução de treinamento. Você pode ver rapidamente execuções anteriores, comparar resultados e reproduzir um resultado de execução anterior, conforme necessário. Depois de identificar a melhor versão de um modelo para produção, registre-a no Registro de Modelos para simplificar as transferências ao longo do ciclo de implantação.

Machine Learning

Gerencie todo o ciclo de vida do modelo, dos dados à produção — e vice-versa

Depois que os modelos treinados forem registrados, você poderá gerenciá-los de forma colaborativa durante todo o ciclo de vida usando o Registro de Modelos. Os modelos podem ser versionados e passar por diferentes etapas, como teste, preparação, produção e arquivamento. A gestão do ciclo de vida se integra aos fluxos de trabalho de aprovação e governança de acordo com os controles de acesso baseados em funções. Comentários e notificações por e-mail fornecem um ambiente colaborativo rico para equipes de dados.

ML Flow

Implante modelos de ML de baixa latência e grande escala

Implante modelos com um único clique, sem se preocupar com gerenciamento de servidor ou restrições de escala. Com a Databricks, você pode implantar seus modelos como endpoints API REST em qualquer lugar com disponibilidade de nível empresarial.

LLM

Use IA generativa e grandes modelos de linguagem

Integre modelos pré-treinados existentes ao seu fluxo de trabalho, como os da biblioteca de transformadores do Hugging Face ou outras bibliotecas de código aberto. Os pipelines de transformador facilitam o uso de GPUs e permitem o batch de itens enviados para a GPU para melhor throughput. 

Personalize um modelo em seus dados para sua tarefa específica. Com o suporte de ferramentas de código aberto, como Hugging Face e DeepSpeed, você pode pegar uma LLM de fundação com rapidez e eficiência e começar a treinar com seus próprios dados para ter mais precisão para seu domínio e carga de trabalho. Isso também permite controlar os dados usados no treinamento para você ter certeza de que está usando a IA com responsabilidade.

Componentes do produto

Collaboration

Notebooks colaborativos

Os notebooks da Databricks são compatíveis nativamente com Python, R, SQL e Scala. Os usuários podem trabalhar com as linguagens e bibliotecas de sua escolha para descobrir, visualizar e compartilhar insights.

Saiba mais
Runtime

Runtime para machine learning

Acesso com um clique a clusters de ML pré-configurados e otimizados com base em uma distribuição escalável e confiável das estruturas de ML mais populares (como PyTorch, TensorFlow e scikit-learn), com otimizações integradas para desempenho inigualável em toda a empresa.

Saiba mais
Feature Store

Feature Store

Facilite a reutilização de recursos com busca baseada em linhagem de dados que aproveita fontes registradas automaticamente. Disponibilize seus recursos para treinamento com implantação de modelos simplificados que não requerem alterações na aplicação cliente.

Saiba mais
Data science

AutoML

Empodere todos, de especialistas em ML a citizen data scientists, com uma abordagem “caixa de vidro” para AutoML, que não apenas fornece o modelo de melhor desempenho, mas também gera código para refinamento adicional por especialistas.

Saiba mais
Unity

MLflow gerenciado

Desenvolvido em MLflow — a principal plataforma de código aberto do mundo para o ciclo de vida de ML — o MLflow Gerenciado ajuda os modelos de ML a passar rapidamente dos testes para a produção, com um alto nível de segurança, confiabilidade e escalabilidade em toda a empresa.

Saiba mais
Icon Production

Disponibilização de modelos de nível de produção

Disponibilize modelos em qualquer escala com um clique, com a opção de computação serverless.

Saiba mais
Icon Structured Streaming

Monitoramento de modelos

Monitore o desempenho do modelo e seu impacto nas métricas de negócios em tempo real. A Databricks oferece visibilidade e linhagem de ponta a ponta, desde modelos de produção até sistemas de dados de origem. A plataforma permite analisar o modelo e a qualidade dos dados durante todo o ciclo de vida do ML e, portanto, identifica problemas antes que tenham impacto prejudicial.

Saiba mais
Repos Icon

Repositórios

Os repositórios permitem que os engenheiros rastreiem os fluxos de trabalho do Git na Databricks. Assim, as equipes de dados podem aproveitar fluxos de trabalho de CI/CD automatizados e portabilidade de código.

Saiba mais
icon machine learning

Grandes modelos de linguagem

A Databricks simplifica o acesso a LLMs e a integração deles em seus fluxos de trabalho e oferece recursos de plataforma para ajustar LLMs usando seus próprios dados, resultando em melhor desempenho de domínio.

Saiba mais

Migre para a Databricks

Não aguenta mais silos de dados, desempenho lento e altos custos associados a sistemas obsoletos, como Hadoop e os data warehouses corporativos? Migre para a Databricks Lakehouse: a plataforma moderna para todos os seus casos de uso de dados, análises e IA.

Migre para a Databricks

Tudo pronto para começar?