DevOps Essentials for Data Engineering - French
Ce cours explore les meilleures pratiques d’ingénierie logicielle et les principes DevOps, spécialement conçus pour les ingénieurs de données travaillant avec Databricks. Les participants construiront une base solide dans les sujets clés tels que la qualité du code, le contrôle de version, la documentation et les tests. Le cours met l’accent sur DevOps, couvrant les composants de base, les avantages et le rôle de l’intégration et de la livraison continues (CI/CD) dans l’optimisation des workflows de data engineering.
Vous apprendrez à appliquer les principes de modularité dans PySpark pour créer des composants réutilisables et structurer le code efficacement. L’expérience pratique comprend la conception et l’implémentation de tests unitaires pour les fonctions PySpark à l’aide du framework pytest, suivis de tests d’intégration pour les pipelines de données Databricks avec DLT et Workflows pour garantir la fiabilité.
Le cours couvre également les opérations essentielles Git au sein de Databricks, y compris l’utilisation des dossiers Databricks Git pour intégrer les pratiques d’intégration continue. Enfin, vous examinerez à haut niveau les différentes méthodes de déploiement des actifs Databricks, tels que les ensembles d’actifs REST API, CLI, SDK, et Databricks (DAB), ce qui vous permettra d’acquérir la connaissance des techniques de déploiement et de gestion de vos pipelines.
À la fin du cours, vous maîtriserez l’ingénierie logicielle et les meilleures pratiques DevOps, ce qui vous permettra de créer des solutions d'ingénierie des données évolutives, maintenables et efficaces.
Languages Available: English | 日本語 | Português BR | 한국어 | Español | française
- Connaissance approfondie de Databricks Platform, y compris l’expérience avec les Databricks Workspaces, Apache Spark, Delta Lake et Medallion Architecture, Unity Catalog, Delta Live Tables, et les Workflows. Une compréhension de base du contrôle de version Git est également requise.
- Expérience de l’ingestion et de la transformation de données, avec une maîtrise de PySpark pour le traitement des données et des manipulations DataFrame. De plus, les candidats doivent avoir de l’expérience dans la rédaction de requêtes SQL de niveau intermédiaire pour l’analyse et la transformation des données.
- Connaissance de la programmation Python, avec une maîtrise de l’écriture de code Python de niveau intermédiaire, y compris la capacité de concevoir et d’implémenter des fonctions et des classes. Les utilisateurs doivent également être compétents dans la création, l’importation et l’utilisation efficace des paquets Python.
Outline
Meilleures pratiques en génie logiciel, DevOps et principes fondamentaux de CI/CD
Introduction aux meilleures pratiques en génie logiciel (SWE)
Introduction à la modularisation du code PySpark
Modularisation du code PySpark
Principes fondamentaux de DevOps
Le rôle de CI/CD dans DevOps
Vérification des connaissances/Discussion
Intégration continue (CI)
Planification du projet
Exploration de la configuration du projet
Introduction aux tests unitaires pour PySpark
Création et exécution de tests unitaires
Exécution de tests d'intégration avec DLT et Workflows
Réalisation de tests d'intégration avec DLT et Workflows
Contrôle de version avec Git - Présentation
Introduction au déploiement continu (CD)
Déploiement des ressources Databricks - Présentation (diapositives)
Déploiement du projet Databricks
Public Class Registration
If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.
Private Class Request
If your company is interested in private training, please submit a request.
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Inscrivez-vous maintenantInstructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
Inscrivez-vous maintenantBlended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

