Ir para o conteúdo principal

Treinamento do modelo

Faça o ajuste fino e pré-treine seus próprios LLMs e outros modelos de IA generativa

Faça o ajuste fino de um LLM de código aberto ou crie LLMs personalizados treinados em seus dados corporativos com o treinamento do modelo Mosaic AI. Os modelos personalizados criados com o treinamento do modelo são mais rápidos, produzem resultados de maior qualidade, mais específicos do domínio e têm custos até dez vezes menores do que os LLMs proprietários.

Simplified training with Serverless GPU Compute

Simplified training with Serverless GPU Compute

Databricks offers fast, serverless access to fully managed GPUs—no setup, no idle costs, no quota management. Bring any model, codebase, or framework. Whether you're experimenting with new architectures or running custom pipelines, you get the flexibility and control to move fast.

This native GPU support is the ideal complement to Mosaic AI Model Training—letting you scale custom training and finetuning workflows while keeping your models and data on a single, secure platform.

A complex image with various elements, including text, diagrams, and charts.

Altamente preciso

O ajuste fino de um LLM de código aberto ou a criação de um novo LLM com dados corporativos leva a uma maior compreensão semântica dos negócios e fornece respostas altamente precisas. Como o treinamento do modelo Mosaic AI está disponível de forma nativa na Databricks, as organizações podem ajustar ou criar modelos com facilidade e segurança sem mover seus dados. Isso também garante governança, auditabilidade, rastreabilidade e monitoramento para garantir que os modelos sejam usados da maneira correta e forneçam as respostas certas. Isso gera resultados precisos e de maior qualidade, específicos para o contexto comercial.

Pretraining compute plane graphic image

Escala sem esforço

A escalabilidade é um fator crítico no desempenho do treinamento de LLMs, que requer uma rede rápida e de baixa latência e acesso às GPUs de mais alto desempenho. O treinamento do modelo Mosaic AI oferece automaticamente acesso a ambos: uma rede NVIDIA InfiniBand e GPUs NVIDIA H100 Tensor Core, as GPUs mais poderosas da NVIDIA, para desempenho incomparável em uma escalabilidade sem precedentes quando comparado ao hardware da geração anterior. Isso dá a capacidade de treinar facilmente modelos grandes (mais de 70 bilhões de parâmetros) e concluir ciclos de treinamento em horas, em vez de dias.

Pretraining shows it can train a Stable Diffusion model for 10x less cost

Econômico

O treinamento do modelo Mosaic AI pode ajustar pequenos LLMs de GenAI de código aberto para produzir modelos altamente eficientes que podem ser disponibilizados de forma até 5 vezes mais econômica do que LLMs proprietários maiores. Além disso, você pode criar novos LLMs do zero usando uma pilha de software otimizada que torna o treinamento de LLMs econômico. Uma combinação de otimizações em todo o sistema, estratégias de paralelismo ajustadas e ciência de treinamento de modelos resulta em um custo 10x menor de treinamento.

model training architecture

Seguro e atende às exigências regulatórias

A segurança é essencial na maioria das organizações. Elas não podem permitir que seus funcionários enviem seus dados a uma API de terceiros e correr o risco de que vazem ou sejam usados para treinar um modelo público. O treinamento do modelo Mosaic AI garante que isso nunca aconteça, pois as organizações construirão seu próprio LLM, onde manterão controle total sobre os dados e o modelo. Tudo é criptografado por padrão, incluindo dados de tráfego e treinamento. Isso garante total confidencialidade dos dados e total controle do modelo, em conformidade com as mais rígidas regulamentações.

Tudo pronto para começar?