Build Data Pipelines with Lakeflow Declarative Pipelines - French
Ce cours présente aux utilisateurs les concepts et compétences essentiels nécessaires pour créer des pipelines de données à l'aide de Lakeflow Spark Declarative Pipelines (SDP) dans Databricks pour l'ingestion et le traitement incrémentiels par lots ou en continu via plusieurs tables de streaming et vues matérialisées. Conçu pour les ingénieurs de données qui découvrent Spark Declarative Pipelines, ce cours offre un aperçu complet des composants essentiels tels que le traitement incrémentiel des données, les tables de streaming, les vues matérialisées et les vues temporaires, en soulignant leurs objectifs spécifiques et leurs différences.
Les thèmes abordés comprennent :
- Développement et débogage de pipelines ETL avec l'éditeur multi-fichiers dans Spark Declarative Pipelines à l'aide de SQL (avec exemples de code Python fournis)
- Comment les pipelines déclaratifs Spark suivent les dépendances des données dans un pipeline à travers le graphe du pipeline
- Configuration des ressources de calcul du pipeline, des actifs de données, des modes de déclenchement et d'autres options avancées
Ensuite, le cours présente les attentes en matière de qualité des données dans les pipelines déclaratifs Spark, guidant les utilisateurs tout au long du processus d'intégration des attentes dans les pipelines afin de valider et de garantir l'intégrité des données. Les apprenants découvriront ensuite comment mettre un pipeline en production, notamment les options de planification, et comment activer la journalisation des événements du pipeline afin de surveiller ses performances et son état de santé.
Enfin, le cours explique comment implémenter la capture des données modifiées (CDC) à l'aide de la syntaxe AUTO CDC INTO dans les pipelines déclaratifs Spark afin de gérer les dimensions à évolution lente (SCD de type 1 et de type 2), préparant ainsi les utilisateurs à intégrer la CDC dans leurs propres pipelines.
⇾ Connaissance de base de la plateforme Databricks Data Intelligence, notamment Databricks Workspaces, Apache Spark, Delta Lake, l'architecture Medallion et Unity Catalog.
⇾ Expérience dans l'ingestion de données brutes dans des tables Delta, y compris l'utilisation de la fonction SQL read_files pour charger des formats tels que CSV, JSON, TXT et Parquet.
⇾ Maîtrise de la transformation des données à l'aide du langage SQL, y compris la rédaction de requêtes de niveau intermédiaire et une compréhension de base des jointures SQL.
Outline
Introduction à l'ingénierie des données dans Databricks
⇾ Ingénierie des données dans Databricks
⇾ Que sont les pipelines déclaratifs Lakeflow Spark ?
⇾ Configuration du cours et création d'un pipeline
⇾ Présentation du projet du cours
Lakeflow Spark Declarative Pipeline Principes fondamentaux
⇾ Présentation des types d'ensembles de données
⇾ Développement simplifié de pipelines
⇾ Paramètres courants des pipelines
⇾ Développement d'un pipeline simple
⇾ Garantir la qualité des données grâce aux attentes
Building Lakeflow Spark Declarative Pipelines
⇾ Présentation des connexions de streaming
⇾ Déploiement d'un pipeline en production
⇾ Présentation de la capture des données modifiées (CDC)
⇾ Capture des données modifiées avec AUTO CDC INTO
⇾ Présentation des fonctionnalités supplémentaires
Public Class Registration
If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.
Private Class Request
If your company is interested in private training, please submit a request.
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Inscrivez-vous maintenantInstructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
Inscrivez-vous maintenantBlended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

