Automated Deployment with Databricks Asset Bundles - Portuguese BR

Este curso fornece uma revisão abrangente dos princípios de DevOps e sua aplicação em projetos Databricks. Ele começa com uma visão geral dos principais DevOps, DataOps, integração contínua (CI), implantação contínua (CD) e testes, e explora como esses princípios podem ser aplicados a pipelines de engenharia de dados.

Em seguida, o curso se concentra na implantação contínua dentro do processo de CI/CD, examinando ferramentas como a API REST do Databricks, o SDK e a CLI para implantação de projetos. Você aprenderá sobre os DABs (Asset Bundles, pacotes de ativos do Databricks) e como eles se encaixam no processo de CI/CD. Você se aprofundará em seus principais componentes, na estrutura de pastas e em como eles simplificam a implantação em vários ambientes de destino no Databricks. Você também aprenderá a adicionar variáveis, modificar, validar, implantar e executar Databricks Asset Bundles para vários ambientes com configurações diferentes usando a CLI do Databricks.

Por fim, o curso apresenta o Visual Studio Code como um ambiente de desenvolvimento interativo (IDE) para criar, testar e implantar Databricks Asset Bundles localmente, otimizando seu processo de desenvolvimento. O curso termina com uma introdução à automação de pipelines de implantação usando ações do GitHub para aprimorar o fluxo de trabalho de CI/CD com Databricks Asset Bundles.

Ao final deste curso, você estará equipado para automatizar as implantações de projetos do Databricks com os Databricks Asset Bundles, melhorando a eficiência por meio de práticas de DevOps.

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Professional

Duration

Prerequisites

Forte conhecimento da plataforma Databricks, incluindo experiência com Databricks Workspaces, Apache Spark, Delta Lake, Medallion Architecture, Unity Catalog, Delta Live Tables e Workflows. Em particular, conhecimento do uso de Expectativas com DLTs.
Experiência em ingestão e transformação de dados, com proficiência em PySpark para processamento de dados e manipulação de DataFrame. Os candidatos também devem ter experiência em escrever consultas SQL de nível intermediário para análise e transformação de dados.
Proficiência em programação Python, incluindo a capacidade de projetar e implementar funções e classes, e experiência com criação, importação e utilização de pacotes Python.
Familiaridade com práticas de DevOps, particularmente integração contínua e princípios de entrega/implantação contínua (CI/CD).
Uma compreensão básica do controle de versão Git.
Pré-requisito do curso: DevOps Essentials para o curso de Engenharia de Dados

Outline

DevOps e CI/CD Revisão

Revisão de DevOps
Integração Contínua e Entrega Contínua Implantação/Entrega (CI/CD) Revisão
Configuração do curso e Autenticação

Deploy com Ativo do Databricks Bundles (DABs)

Implantação de Databricks Projetos
Introdução a Recurso Databricks Pacotes (DABs)
Implantando um DAB simples
Implantação de um DAB simples
Substituições de variáveis em DABs
Implantando um DAB (Pacote de Ativos de Databricks) em Vários ambientes
Implantar um DAB em vários ambientes
Visão geral dos templates de projeto DAB
Usar um modelo de DAB padrão do Databricks
Visão geral do projeto de CI/CD com DABs
Integração Contínua e Entrega Contínua Implantação com DABs
Adicionando ML a Fluxos de trabalho de Engenharia com DABs

Fazendo mais com Ativo Databricks Pacotes

Desenvolvendo localmente com o Visual Studio Code (VSCode)
Usando o VSCode com Databricks
Práticas recomendadas de CI/CD para Engenharia de Dados
Próximos passos: Implantação automatizada com GitHub Actions

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analyst

Data Warehousing with Databricks - Portuguese BR

Este curso foi desenvolvido para profissionais de dados que desejam explorar os recursos de Data Warehousing do Databricks. Supondo que não haja conhecimento prévio do Databricks, ele fornece uma introdução ao uso do Databricks como uma solução moderna de Data Warehousing baseada em nuvem. Os alunos explorarão como usar a Databricks Data Intelligence Platform para ingerir, transformar, governar e analisar dados de forma eficiente usando o dataset padrão TCP-DI do setor como referência. Os alunos também explorarão o Genie, um recurso inovador do Databricks que simplifica a exploração de dados por meio de queries em linguagem natural. Ao final deste curso, os participantes serão equipados com as habilidades fundamentais para implementar e otimizar um data warehouse usando o Databricks.

Languages Available: English | 日本語 | Português BR | 한국어

Data Analysis with Databricks - Portuguese BR

Este curso fornece uma introdução abrangente ao Databricks SQL. Os alunos irão ingerir dados, escrever queries, produzir visualizações e painéis e configurar alertas. Este curso irá prepará-lo para fazer o exame Analista Associado de Dados, Certificado da Databricks. Este curso é composto por dois módulos de quatro horas.

SQL Analytics on Databricks

Neste curso, você aprenderá a usar efetivamente a Databricks para análise de dados, com foco específico no Databricks SQL. Como Analista de Dados da Databricks, suas responsabilidades incluirão encontrar dados relevantes, analisá-los para possíveis aplicações e transformá-los em formatos que forneçam percepções de negócios valiosos.

Você também entenderá sua função no gerenciamento de objetos de dados e como manipulá-los na Databricks Data Intelligence Platform, usando ferramentas como Notebooks, Editor SQL e Databricks SQL.

Além disso, você aprenderá sobre a importância do Unity Catalog no gerenciamento de ativos de dados e da plataforma como um todo. Por fim, o curso fornecerá uma visão geral de como o Databricks facilita a otimização de desempenho e ensinará como acessar percepções de query para entender os processos que ocorrem nos bastidores ao executar a analítica SQL no Databricks.

AI/BI for Data Analysts

Neste curso, você aprenderá a usar os recursos que o Databricks fornece para as necessidades de business intelligence: Painéis de IA/BI e AI/BI Genie. Como Analista de Dados da Databricks, você terá a tarefa de criar Painéis de IA/BI e AI/BI Genie Spaces dentro da plataforma, gerenciar o acesso a esses ativos pelas partes interessadas e necessárias e manter esses ativos à medida que são editados, atualizados ou desativados ao longo de sua vida útil. Este curso pretende instruir os participantes sobre como projetar painéis para percepções de negócios, compartilhá-los com colaboradores e partes interessadas e manter esses ativos dentro da plataforma. Os participantes também aprenderão a utilizar os AI/BI Genie Spaces para dar suporte à análise de autoatendimento por meio da criação e manutenção desses ambientes alimentados pelo Databricks Data Intelligence Engine.

Languages Available: English | 日本語 | Português BR | 한국어

Build Data Pipelines with Delta Live Tables - Portuguese BR

Neste curso, você aprenderá a definir e programar pipelines de dados que ingerem e processam dados de forma incremental por meio de várias tabelas no lakehouse usando Delta Live Tables (DLT) em Spark SQL e Python. O curso aborda como começar a usar o DLT, como o DLT rastreia dependências de dados em pipelines de dados, como configurar e executar pipelines de dados usando a interface do usuário do Delta Live Tables, como usar Python ou Spark SQL para definir pipelines de dados que ingerem e processam dados por meio de várias tabelas no lakehouse usando Auto Loader e DLT, como usar a sintaxe APPLY CHANGES INTO para processar feeds de captura de dados de alterações (CDC) e como revisar logs de eventos e artefatos de dados criados por pipelines e solucionar problemas de sintaxe DLT.

Languages Available: English | 日本語 | Português BR | 한국어