Ir para o conteúdo principal

Machine Learning Model Development - Portuguese BR

Este curso abrangente fornece um guia prático para o desenvolvimento de modelos tradicionais de aprendizado de máquina no Databricks, enfatizando demonstrações práticas e fluxos de trabalho usando bibliotecas de ML populares. Os participantes explorarão as principais técnicas de ML, incluindo regressão e clustering, enquanto aproveitam os poderosos recursos do Databricks. O curso aborda a integração do MLflow para rastreamento de modelos, a Databricks Feature Store para gerenciamento de recursos e o Optuna para ajuste de hiperparâmetros. Além disso, os participantes aprenderão como acelerar o desenvolvimento de modelos com o Genie Code, o assistente de codificação baseado em IA da Databricks que usa linguagem natural, conexões MCP, instruções e habilidades para orientar todo o ciclo de vida de ML. Ao final do curso, os alunos terão habilidades práticas do mundo real para desenvolver, otimizar e implantar modelos de aprendizado de máquina de forma eficiente no ambiente Databricks.


Languages Available: English日本語 | Português BR | 한국어

Skill Level
Associate
Duration
4h
Prerequisites

No mínimo, você deve conhecer os itens a seguir antes de tentar aprender esse conteúdo:

• Familiaridade com a Databricks Data Intelligence Platform e operações básicas de workspace (criar clusters, run code in notebooks, use basic notebook operations, import repos from git)

• Experiência intermediária em programação com Python, incluindo bibliotecas de manipulação de dados (pandas, numpy) e trabalhando com APIs (databricks-sdk, REST endpoints)

• Conhecimento básico de MLflow para experiment tracking, model logging, model registry operations e model versioning

• Compreensão dos fundamentos de machine learning, incluindo model training, evaluation, batch inference e conceitos de real-time deployment

• Experiência intermediária com Unity Catalog para data governance e gerenciamento de model registry

• Familiaridade básica com Feature Engineering concepts, incluindo feature tables, feature lookups e feature store offline vs online

• Entendimento das operações do Delta Lake (criar tabelas, realizar atualizações, otimizar arquivos e liquid clustering) e técnicas de otimização de armazenamento de dados

• Conhecimento básico de Apache Spark e PySpark para processamento de dados distribuídos e User Defined Functions (UDFs)

Outline

Fluxo de trabalho de desenvolvimento de modelos

Desenvolvimento de Modelos e MLflow

Avaliando o Desempenho do Modelo


Ajuste de hiperparâmetros

Fundamentos de ajuste de hiperparâmetros

Ajuste de hiperparâmetros com o Optuna


Agentic Machine Learning

Introdução ao Genie Code

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Private Class Request

If your company is interested in private training, please submit a request.

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Runtime

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Registre-se agora

Instructors

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

Registre-se agora

Learning

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Scale

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Questions?

If you have any questions, please refer to our Frequently Asked Questions page.