Advanced Techniques with Spark Declarative Pipelines - Portuguese BR
Este curso explora os Spark Declarative Pipelines (SDP) da Databricks Lakeflow para a construção de pipelines de transmissão de nível de produção. Aprenderá padrões de design avançados, aplicação robusta da qualidade de dados e integração multiplataforma, essenciais para a engenharia de lakehouses no mundo real.
Ao longo do curso, irá aprofundar técnicas modernas de ingestão e processamento de dados, dominando ferramentas como o Liquid Clustering para otimização de layout e o padrão Multiplex Streaming para eventos com esquemas mistos. No final dos módulos, saberá como lidar com confiança com a evolução de esquemas, automatizar a Change Data Capture (CDC) e garantir a integridade dos dados.
Através de aulas teóricas e demonstrações práticas, irá:
• Construir pipelines de múltiplos fluxos para ingerir dados de múltiplas fontes numa tabela Bronze unificada.
• Aplicar o algoritmo Liquid Clustering e as Expectativas de Qualidade de Dados nas camadas Prata e Ouro.
• Implementar o padrão Multiplex com Iceberg UniForm para acesso a dados multiplataforma.
• Automatizar o seguimento do histórico de SCD Tipo 2 utilizando o AUTO CDC INTO.
• Conceber pipelines de quarentena sem perda de dados para auditar e gerir registros inválidos.
Observação: A Databricks Academy está a migrar para um formato baseado em notebooks para as aulas dentro do ambiente Databricks, descontinuando o uso de diapositivos nas aulas. Pode aceder aos notebooks das aulas no ambiente de laboratório Vocareum.
Languages Available: English | 日本語 | Português BR | 한국어
No mínimo, você deve conhecer os itens a seguir antes de tentar aprender esse conteúdo:
• Spark Declarative Pipelines — Conclusão do curso "Criar Pipelines de Dados com Lakeflow Spark Declarative Pipelines" ou familiaridade com CREATE OR REFRESH STREAMING TABLE, CONSTRAINTS e a interface de utilizador do Pipelines
• Fundamentos do Delta Lake — Compreensão das tabelas Delta e de como o Delta gere os ficheiros de dados e os registos de transações
• Conceitos de Transmissão — Conhecimentos de transmissão em micro-lotes, checkpointing e processamento em tempo de evento no SDP
• Proficiência em SQL — Capacidade de ler e escrever SQL, incluindo SELECT, JOIN, MERGE, CASE WHEN e funções agregadas comuns
• Python em Databricks Notebooks — Familiaridade com a leitura e execução de código Python em Databricks Notebooks
• Noções básicas do Unity Catalog — Compreensão dos catálogos, esquemas, tabelas e volumes do Unity Catalog
Outline
• Introdução a Fluxos Múltiplos, Expectativa e Agrupamento Líquido em SDP
• Demo: Multi Flow SDP com Agrupamento Líquido e Qualidade de Dados
• Introdução ao Transmissão de Multiplex, Delta Sinks e Leituras Iceberg
• Demo: Transmissão de Multiplex SDP com Delta Sinks e Leituras Iceberg
• Revisão de Change Data Capture (CDC)
• Demo: Automatizando SCD Tipo 2 com AUTO CDC no Lakeflow Spark Declarative Pipelines
• Verificações avançadas de qualidade de dados e expectativas em SDP
• Demo: Verificações avançadas de qualidade de dados e expectativas em SDP
• Lab - Construir um pipeline de comércio eletrónico de múltiplas fontes com SDP
Public Class Registration
If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.
Private Class Request
If your company is interested in private training, please submit a request.
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Registre-se agoraInstructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
Registre-se agoraBlended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

