Machine Learning Model Development - Portuguese BR
Este curso abrangente fornece um guia prático para o desenvolvimento de modelos tradicionais de aprendizado de máquina no Databricks, enfatizando demonstrações práticas e fluxos de trabalho usando bibliotecas de ML populares. Os participantes explorarão as principais técnicas de ML, incluindo regressão e clustering, enquanto aproveitam os poderosos recursos do Databricks. O curso aborda a integração do MLflow para rastreamento de modelos, a Databricks Feature Store para gerenciamento de recursos e o Optuna para ajuste de hiperparâmetros. Além disso, os participantes aprenderão como acelerar o desenvolvimento de modelos com o Genie Code, o assistente de codificação baseado em IA da Databricks que usa linguagem natural, conexões MCP, instruções e habilidades para orientar todo o ciclo de vida de ML. Ao final do curso, os alunos terão habilidades práticas do mundo real para desenvolver, otimizar e implantar modelos de aprendizado de máquina de forma eficiente no ambiente Databricks.
Languages Available: English | 日本語 | Português BR | 한국어
No mínimo, você deve conhecer os itens a seguir antes de tentar aprender esse conteúdo:
• Familiaridade com a Databricks Data Intelligence Platform e operações básicas de workspace (criar clusters, run code in notebooks, use basic notebook operations, import repos from git)
• Experiência intermediária em programação com Python, incluindo bibliotecas de manipulação de dados (pandas, numpy) e trabalhando com APIs (databricks-sdk, REST endpoints)
• Conhecimento básico de MLflow para experiment tracking, model logging, model registry operations e model versioning
• Compreensão dos fundamentos de machine learning, incluindo model training, evaluation, batch inference e conceitos de real-time deployment
• Experiência intermediária com Unity Catalog para data governance e gerenciamento de model registry
• Familiaridade básica com Feature Engineering concepts, incluindo feature tables, feature lookups e feature store offline vs online
• Entendimento das operações do Delta Lake (criar tabelas, realizar atualizações, otimizar arquivos e liquid clustering) e técnicas de otimização de armazenamento de dados
• Conhecimento básico de Apache Spark e PySpark para processamento de dados distribuídos e User Defined Functions (UDFs)
Outline
Fluxo de trabalho de desenvolvimento de modelos
Desenvolvimento de Modelos e MLflow
Avaliando o Desempenho do Modelo
Ajuste de hiperparâmetros
Fundamentos de ajuste de hiperparâmetros
Ajuste de hiperparâmetros com o Optuna
Agentic Machine Learning
Introdução ao Genie Code
Public Class Registration
If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.
Private Class Request
If your company is interested in private training, please submit a request.
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Registre-se agoraInstructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
Registre-se agoraBlended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

