Databricks Streaming and Lakeflow Spark Declarative Pipelines - Portuguese BR

Este curso oferece uma compreensão abrangente do Spark Structured Streaming e do Delta Lake, incluindo modelos de compute, configuração para leitura de dados em tempo real e manutenção da qualidade dos dados num ambiente de transmissão.

Nota: Este curso faz parte da série de cursos "Data Engineering Avançada com o Databricks".

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Professional

Duration

Prerequisites

No mínimo, você deve conhecer os itens a seguir antes de tentar aprender esse conteúdo:

• Capacidade de realizar tarefas básicas de desenvolvimento de código utilizando o Databricks Data Engineering and Data Science workspace (criar clusters, executar código em notebooks, utilizar operações básicas de notebooks, importar repositórios do Git, etc.)

• Experiência intermédia em programação com PySpark

• Extrair dados de diversos formatos de ficheiros e fontes de dados

• Aplicar diversas transformações comuns para limpar os dados

• Reestruturar e manipular dados complexos utilizando funções integradas avançadas

• Experiência intermediária em programação com Delta Lake (criação de tabelas, realização de atualizações completas e incrementais, compressão de ficheiros, restauro de versões anteriores, etc.)

• Experiência básica na configuração e programação de pipelines de dados utilizando a interface de utilizador do Lakeflow Spark Declarative Pipelines

• Experiência básica na definição de Lakeflow Spark Declarative Pipelines utilizando o PySpark

• Ingestão e processamento de dados utilizando Auto Loader e sintaxe PySpark

• Processamento de Change Data Capture feeds com a sintaxe APPLY CHANGES INTO

• Análise de log de eventos e resultados de pipelines para resolver problemas de sintaxe de Declarative Pipeline

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Registre-se agora

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

Registre-se agora

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Databricks Accredited Platform Administrator Accreditation - Portuguese BR

O exame Databricks Certified Platform Administrator é um exame de certificação não supervisionado com duração de 20 minutos que avalia os conhecimentos sobre gerenciamento e operação da plataforma Databricks Lakehouse usando o Unity Catalog. Este exame avalia sua capacidade de realizar operações fundamentais de gerenciamento da plataforma, gerenciar identidade e controle de acesso, configurar as definições da plataforma e medidas de segurança, gerenciar recursos de computação, gerenciar e proteger dados dentro da plataforma e gerenciar ferramentas de CI/CD dentro da plataforma. Os candidatos que forem aprovados no exame receberão o selo de Administrador de Plataforma Certificado pela Databricks e um certificado.

Free

15m

Associate

Databricks Platform Administration Fundamentals - Portuguese BR

Neste curso, você aprenderá os fundamentos de administração da plataforma no Databricks Data Intelligence Platform. Ele abrange a arquitetura Databricks, o modelo de segurança, as funções administrativas, o gerenciamento de recursos em cloud e as técnicas de automação. Você explorará as principais responsabilidades administrativas, incluindo o gerenciamento de workspaces, metastores e armazenamento externo, garantindo a segurança por meio de controles de acesso e privilégios baseados em função. Além disso, você aprenderá a automatizar tarefas administrativas usando o Databricks SDK, CLI, e Terraform. O curso inclui demonstrações práticas para reforçar conceitos e simplificar o gerenciamento da plataforma. Ao final, você estará equipado para administrar, proteger e automatizar com eficiência os ambientes Databricks em sua organização.

Free

1h 30m

Introductory

Platform Administrator

Get Started with Databricks Platform Administration - Portuguese BR

Neste curso, você aprenderá os conceitos básicos de administração de plataforma no Databricks Data Intelligence Platform. Ele oferece uma visão abrangente do Unity Catalog, um componente vital para uma governança de dados eficaz em ambientes Databricks. Dividido em cinco módulos, ele começa com uma introdução detalhada à infraestrutura Databricks e sua data intelligence platform, incluindo um passo a passo detalhado do Databricks Workspace. Você explorará os princípios de governança de dados dentro do Unity Catalog, abordando seus principais conceitos, arquitetura e funções. O curso enfatiza ainda o gerenciamento de metastores Unity Catalog e recursos de compute, incluindo clusters e warehouses SQL. Por fim, você dominará o controle de acesso a dados aprendendo sobre privilégios, acesso refinado e como controlar objetos de dados. Ao final, você estará equipado com habilidades essenciais para administrar o Unity Catalog para implementar uma governança de dados eficaz, otimizar recursos de compute e aplicar estratégias robustas de segurança de dados. Com a compra de uma assinatura Databricks Labs, o curso também se encerra com um exercício de laboratório abrangente para praticar o que você aprendeu em um ambiente Databricks Workspace ao vivo.

Languages Available: English | 日本語 | Português BR | 한국어

Free

instructor-led

Onboarding