Machine Learning Model Development - Portuguese BR

Este curso abrangente fornece um guia prático para o desenvolvimento de modelos tradicionais de aprendizado de máquina no Databricks, enfatizando demonstrações práticas e fluxos de trabalho usando bibliotecas de ML populares. Os participantes explorarão as principais técnicas de ML, incluindo regressão e clustering, enquanto aproveitam os poderosos recursos do Databricks. O curso aborda a integração do MLflow para rastreamento de modelos, a Databricks Feature Store para gerenciamento de recursos e o Optuna para ajuste de hiperparâmetros. Além disso, os participantes aprenderão como acelerar o desenvolvimento de modelos com o Genie Code, o assistente de codificação baseado em IA da Databricks que usa linguagem natural, conexões MCP, instruções e habilidades para orientar todo o ciclo de vida de ML. Ao final do curso, os alunos terão habilidades práticas do mundo real para desenvolver, otimizar e implantar modelos de aprendizado de máquina de forma eficiente no ambiente Databricks.

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Associate

Duration

Prerequisites

No mínimo, você deve conhecer os itens a seguir antes de tentar aprender esse conteúdo:

• Familiaridade com a Databricks Data Intelligence Platform e operações básicas de workspace (criar clusters, run code in notebooks, use basic notebook operations, import repos from git)

• Experiência intermediária em programação com Python, incluindo bibliotecas de manipulação de dados (pandas, numpy) e trabalhando com APIs (databricks-sdk, REST endpoints)

• Conhecimento básico de MLflow para experiment tracking, model logging, model registry operations e model versioning

• Compreensão dos fundamentos de machine learning, incluindo model training, evaluation, batch inference e conceitos de real-time deployment

• Experiência intermediária com Unity Catalog para data governance e gerenciamento de model registry

• Familiaridade básica com Feature Engineering concepts, incluindo feature tables, feature lookups e feature store offline vs online

• Entendimento das operações do Delta Lake (criar tabelas, realizar atualizações, otimizar arquivos e liquid clustering) e técnicas de otimização de armazenamento de dados

• Conhecimento básico de Apache Spark e PySpark para processamento de dados distribuídos e User Defined Functions (UDFs)

Outline

Fluxo de trabalho de desenvolvimento de modelos

Desenvolvimento de Modelos e MLflow

Avaliando o Desempenho do Modelo

Ajuste de hiperparâmetros

Fundamentos de ajuste de hiperparâmetros

Ajuste de hiperparâmetros com o Optuna

Agentic Machine Learning

Introdução ao Genie Code

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Customer registration Partner registration

Private Class Request

If your company is interested in private training, please submit a request.

Request Private Training

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Registre-se agora

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

Registre-se agora

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Architecting Data Warehouses for Large-Scale Deployments - Portuguese BR

Este curso aborda a otimização de desempenho, o controle de custos e a segurança para implantações de data warehousing em grande escala.

Este curso é destinado a profissionais de data warehousing responsáveis por gerenciar ambientes Databricks que atendem centenas ou milhares de usuários em várias unidades de negócio. Você adquirirá as habilidades necessárias para escalar com eficiência as operações de data warehousing, mantendo alto desempenho, custo-benefício e conformidade com os padrões de segurança.

Observação: A Databricks Academy está a migrar para um formato baseado em notebooks para as aulas dentro do ambiente Databricks, descontinuando o uso de diapositivos nas aulas. Pode aceder aos notebooks das aulas no ambiente de laboratório Vocareum.

Languages Available: English | 日本語 | 한국어 | Español | française

Building ETL Pipelines with SQL - Portuguese BR

Este curso ensina como criar ETL pipelines prontos para produção usando SQL puro na Databricks Data Intelligence Platform. Os alunos aprendem Streaming Tables com Auto Loader para ingestão incremental, Materialized Views com atualização incremental para transformações Prata para Ouro, AUTO CDC (FLOW AUTO CDC) para gerenciamento declarativo de dimensões SCD Tipo 1 e Tipo 2, e Lakeflow Jobs com tarefas de arquivo SQL para orquestração em produção. O curso segue um dataset de varejo realista através da arquitetura medalhão (Bronze → Prata → Ouro).

Observação: a Databricks Academy está mudando para um formato baseado em cadernos para as aulas presenciais no ambiente Databricks, deixando de usar apresentações de slides para as palestras. Você pode acessar os cadernos das palestras no ambiente de laboratório Vocareum.

Databricks Performance Optimization - Portuguese BR

Neste curso, aprenderá como otimizar as cargas de trabalho e o layout físico com o Spark e o Delta Lake, bem como analisar a interface do utilizador do Spark para avaliar o desempenho e depurar aplicações. Abordaremos temas como transmissão, net clustering, data skipping, cache, photons e muito mais.

Languages Available: English | 日本語 | Português BR | 한국어