Revenir au contenu principal

DevOps Essentials for Data Engineering - French

Ce cours explore les meilleures pratiques d’ingénierie logicielle et les principes DevOps, spécialement conçus pour les ingénieurs de données travaillant avec Databricks. Les participants construiront une base solide dans les sujets clés tels que la qualité du code, le contrôle de version, la documentation et les tests. Le cours met l’accent sur DevOps, couvrant les composants de base, les avantages et le rôle de l’intégration et de la livraison continues (CI/CD) dans l’optimisation des workflows de data engineering.


Vous apprendrez à appliquer les principes de modularité dans PySpark pour créer des composants réutilisables et structurer le code efficacement. L’expérience pratique comprend la conception et l’implémentation de tests unitaires pour les fonctions PySpark à l’aide du framework pytest, suivis de tests d’intégration pour les pipelines de données Databricks avec DLT et Workflows pour garantir la fiabilité.


Le cours couvre également les opérations essentielles Git au sein de Databricks, y compris l’utilisation des dossiers Databricks Git pour intégrer les pratiques d’intégration continue. Enfin, vous examinerez à haut niveau les différentes méthodes de déploiement des actifs Databricks, tels que les ensembles d’actifs REST API, CLI, SDK, et Databricks (DAB), ce qui vous permettra d’acquérir la connaissance des techniques de déploiement et de gestion de vos pipelines.


À la fin du cours, vous maîtriserez l’ingénierie logicielle et les meilleures pratiques DevOps, ce qui vous permettra de créer des solutions d'ingénierie des données évolutives, maintenables et efficaces.


Languages Available: English | 日本語 | Português BR | 한국어 | Español | française

Skill Level
Associate
Duration
4h
Prerequisites

- Connaissance approfondie de Databricks Platform, y compris l’expérience avec les Databricks Workspaces, Apache Spark, Delta Lake et Medallion Architecture, Unity Catalog, Delta Live Tables, et les Workflows. Une compréhension de base du contrôle de version Git est également requise.

- Expérience de l’ingestion et de la transformation de données, avec une maîtrise de PySpark pour le traitement des données et des manipulations DataFrame. De plus, les candidats doivent avoir de l’expérience dans la rédaction de requêtes SQL de niveau intermédiaire pour l’analyse et la transformation des données.

- Connaissance de la programmation Python, avec une maîtrise de l’écriture de code Python de niveau intermédiaire, y compris la capacité de concevoir et d’implémenter des fonctions et des classes. Les utilisateurs doivent également être compétents dans la création, l’importation et l’utilisation efficace des paquets Python.

Outline

Meilleures pratiques en génie logiciel, DevOps et principes fondamentaux de CI/CD

Introduction aux meilleures pratiques en génie logiciel (SWE)

Introduction à la modularisation du code PySpark

Modularisation du code PySpark

Principes fondamentaux de DevOps

Le rôle de CI/CD dans DevOps

Vérification des connaissances/Discussion


Intégration continue (CI)

Planification du projet

Exploration de la configuration du projet

Introduction aux tests unitaires pour PySpark

Création et exécution de tests unitaires

Exécution de tests d'intégration avec DLT et Workflows

Réalisation de tests d'intégration avec DLT et Workflows

Contrôle de version avec Git - Présentation


Introduction au déploiement continu (CD)

Déploiement des ressources Databricks - Présentation (diapositives)

Déploiement du projet Databricks

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Private Class Request

If your company is interested in private training, please submit a request.

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Runtime

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Inscrivez-vous maintenant

Instructors

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

Inscrivez-vous maintenant

Learning

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Scale

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analysis with Databricks - French

SQL Analytics on DatabricksDans ce cours, vous apprendrez à utiliser efficacement Databricks pour l’analyse de données, en mettant l’accent sur Databricks SQL. En tant qu’analyste de données Databricks, vos responsabilités comprendront la recherche de données pertinentes, l’analyse des données pour des applications potentielles et la transformation des données en formats qui fournissent des insights commerciaux précieux. Vous comprendrez également votre rôle dans la gestion des objets de données et comment les manipuler au sein du Databricks Data Intelligence Platform, à l’aide d’outils tels que Notebooks, l’éditeur SQL et Databricks SQL. De plus, vous découvrirez l’importance de Unity Catalog dans la gestion des actifs de données et de la plateforme globale. Enfin, le cours fournira un aperçu de la façon dont Databricks facilite l’optimisation des performances et vous apprendra comment accéder à Query Insights pour comprendre les processus qui se déroulent en coulisse lors de l’exécution de l’analyse SQL sur Databricks.

AI/BI for Data Analysts

Ce cours apprend aux analystes de données à concevoir, créer, publier et exploiter des AI/BI Dashboards dans Databricks. Les AI/BI Dashboards associent des données gouvernées par Unity Catalog à des visualisations interactives, des filtres et l'intégration de Genie, afin que les utilisateurs métier puissent explorer les réponses sans écrire de code.

Le cours suit une seule réalisation de bout en bout. Vous commencez avec des tables sources dans Unity Catalog et terminez avec un tableau de bord multipage publié et surveillé. En chemin, vous découvrez comment les tableaux de bord s'intègrent dans la famille de produits AI/BI de Databricks et où interviennent Genie, les jeux de données, les visualisations et les filtres dans le flux de travail.

Remarque: Databricks Academy passe à un format basé sur des cahiers de travail pour les sessions en présentiel au sein de l'environnement Databricks, et abandonne ainsi l'utilisation de présentations PowerPoint pour les cours magistraux. Vous pouvez accéder aux cahiers de travail des cours dans l'environnement de laboratoire Vocareum.

Languages Available: English | 日本語 | Português BR | 한국어

Paid
8h
Lab
instructor-led
Associate

Questions?

If you have any questions, please refer to our Frequently Asked Questions page.