Building ETL Pipelines with SQL - French
Ce cours enseigne comment créer des pipelines ETL prêts pour la production en utilisant exclusivement SQL sur la Databricks Data Intelligence Platform. Les participants découvrent les Streaming Tables avec Auto Loader pour l'ingestion incrémentielle, les Materialized Views avec rafraîchissement incrémentiel pour les transformations Silver vers Gold, AUTO CDC (FLOW AUTO CDC) pour la gestion déclarative des dimensions SCD Type 1 et Type 2, ainsi que Lakeflow Jobs avec des tâches SQL File pour l'orchestration en production. Le cours suit un jeu de données retail réaliste à travers l'architecture en médaillon (Bronze → Silver → Gold).
Remarque : Databricks Academy passe à un format basé sur des cahiers de travail pour les sessions en présentiel au sein de l'environnement Databricks, et abandonne ainsi l'utilisation de présentations PowerPoint pour les cours magistraux. Vous pouvez accéder aux cahiers de travail des cours dans l'environnement de laboratoire Vocareum.
Le contenu a été développé pour les participants possédant ces compétences/connaissances/aptitudes:
• Naviguer dans le workspace Databricks (barre latérale, Catalog Explorer, SQL Editor)
• Notions de base d'Unity Catalog (catalogues, schémas, tables, volumes)
• SQL intermédiaire (SELECT, JOIN, GROUP BY, CAST, COALESCE, CREATE TABLE)
• Concepts d'entreposage de données (tables de faits/dimensions, schémas en étoile, architecture en médaillon)
• Compréhension de base des workflows ETL
Outline
ETL SQL sur Databricks
• L'ETL SQL sur Databricks : vue d'ensemble
• Démo: Exploration du jeu de données du cours et de l'éditeur SQL
• Atelier: Utilisation de l'éditeur SQL et de Genie Code
Streaming Tables et Materialized Views
• Création de pipelines ETL SQL
• Démo: Création d'un pipeline Bronze vers Silver
• Atelier: Création d'un pipeline de feedback client
Auto CDC
• Mises à jour des dimensions en streaming avec AUTO CDC
• Démo: Création de dimensions à variation lente (SCD) avec AUTO CDC
• Atelier: Création de dimensions à variation lente (SCD)
Orchestration avec Lakeflow Jobs
• Orchestration de pipelines SQL avec Lakeflow Jobs
• Démo: Création d'un Lakeflow Job pour le pipeline ETL
• Atelier: Orchestration de pipelines SQL avec Lakeflow Jobs
Public Class Registration
If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.
Private Class Request
If your company is interested in private training, please submit a request.
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Inscrivez-vous maintenantInstructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
Inscrivez-vous maintenantBlended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

