Ir para o conteúdo principal

Deploy Workloads with Lakeflow Jobs - Portuguese BR

O curso Implante cargas de trabalho com Lakeflow Jobs ensina como orquestrar e automatizar fluxos de trabalho de dados, análises e IA usando o Lakeflow Jobs como uma plataforma de orquestração unificada dentro do ecossistema Databricks. 

⇾ Você aprenderá a projetar e implementar cargas de trabalho de dados usando gráficos acíclicos direcionados (DAGs), configurar várias opções de agendamento e implementar recursos avançados de fluxo de trabalho, como execução condicional de tarefas, dependências run-if e loops for each. 

⇾ O curso aborda as melhores práticas para criar pipelines robustos e prontos para produção com seleção adequada de computação, orquestração modular, técnicas de tratamento de erros e design tolerante a falhas, tudo integrado nativamente à plataforma de inteligência de dados Databricks.


Languages Available: English | 日本語 | Português BR | 한국어 | Español | française

Skill Level
Associate
Duration
4h
Prerequisites
  • ⇾ Conclusão do curso “Introdução ao Databricks para engenharia de dados” ou sólido conhecimento da plataforma de inteligência de dados Databricks.

⇾ Conhecimento básico de tópicos como navegação no Databricks Workspace, Apache Spark, Delta Lake, arquitetura Medallion e Unity Catalog.

⇾ Familiaridade com python/pyspark.

⇾ Experiência na escrita de consultas SQL de nível intermediário.

Outline

Introdução à engenharia de dados no Databricks

⇾ Engenharia de dados no Databricks

⇾ O que são tarefas do Lakeflow?


Conceitos básicos das tarefas do Lakeflow

⇾ Componentes básicos das tarefas do Lakeflow

⇾ Orquestração de tarefas

⇾ Criação de uma tarefa usando a interface do usuário das tarefas do Lakeflow


Criação e programação de Jobs

⇾ Opções comuns de configuração de tarefas

⇾ Programação e acionadores de Jobs

⇾ Demonstração - Explorando as opções de programação


Recursos avançados do Lakeflow Jobs

⇾ Tarefas condicionais e iterativas

⇾ Tratamento de falhas nas tarefas

⇾ Lakeflow Jobs em produção

⇾ Práticas recomendadas

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Private Class Request

If your company is interested in private training, please submit a request.

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Runtime

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Registre-se agora

Instructors

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

Registre-se agora

Learning

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Scale

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Engineer

Advanced Techniques with Spark Declarative Pipelines - Portuguese BR

Este curso explora os Spark Declarative Pipelines (SDP) da Databricks Lakeflow para a construção de pipelines de transmissão de nível de produção. Aprenderá padrões de design avançados, aplicação robusta da qualidade de dados e integração multiplataforma, essenciais para a engenharia de lakehouses no mundo real.

Ao longo do curso, irá aprofundar técnicas modernas de ingestão e processamento de dados, dominando ferramentas como o Liquid Clustering para otimização de layout e o padrão Multiplex Streaming para eventos com esquemas mistos. No final dos módulos, saberá como lidar com confiança com a evolução de esquemas, automatizar a Change Data Capture (CDC) e garantir a integridade dos dados.

Através de aulas teóricas e demonstrações práticas, irá:

• Construir pipelines de múltiplos fluxos para ingerir dados de múltiplas fontes numa tabela Bronze unificada.

• Aplicar o algoritmo Liquid Clustering e as Expectativas de Qualidade de Dados nas camadas Prata e Ouro.

• Implementar o padrão Multiplex com Iceberg UniForm para acesso a dados multiplataforma.

• Automatizar o seguimento do histórico de SCD Tipo 2 utilizando o AUTO CDC INTO.

• Conceber pipelines de quarentena sem perda de dados para auditar e gerir registros inválidos.

Observação: A Databricks Academy está a migrar para um formato baseado em notebooks para as aulas dentro do ambiente Databricks, descontinuando o uso de diapositivos nas aulas. Pode aceder aos notebooks das aulas no ambiente de laboratório Vocareum.

Languages Available: English | 日本語 | Português BR | 한국어

Paid
4h
Lab
instructor-led
Professional

Questions?

If you have any questions, please refer to our Frequently Asked Questions page.