Orchestration

Qu’est-ce que l’orchestration ?

L’orchestration est la coordination et la gestion de plusieurs systèmes informatiques, applications et/ou services, qui enchaînent des tâches multiples afin d’exécuter des workflows ou des processus plus larges. Ces processus peuvent consister en de multiples tâches automatisées et impliquer plusieurs systèmes.

L’orchestration a pour but de faciliter et optimiser l’exécution de processus récurrents et reproductibles. Les équipes data peuvent ainsi gérer plus facilement des tâches et des workflows complexes. Chaque fois qu’un processus est reproductible et que ses tâches peuvent être automatisées, l’orchestration peut intervenir. Elle permettra de gagner en temps et en efficacité, mais aussi d’éliminer les redondances. Vous pouvez par exemple utiliser l’orchestration des jobs pour simplifier les données et le machine learning.

Poursuivez votre exploration

Le Grand Livre du Data Engineering

Dopez votre expertise avec ce guide essentiel sur l'ère de l'IA.

O’Reilly technical guide about ETL pipelines

Démarrer avec l'ETL

Explorez les pipelines ETL dans ce guide technique O'Reilly.

TÉLÉCHARGER MAINTENANT

Promotional graphic for Eckerson Group's white paper on 'Data Pipeline Orchestration: Modernizing Workflows with AI/ML.' The graphic shows a modern building facade with geometric glass patterns in the background, with the white paper title in the foreground. A red circular badge on the right side contains the text 'LEARN THE WHAT, WHY AND HOW' in white letters.

Rapport Eckerson : Orchestration des pipelines de données

Découvrez le rôle stratégique de l'orchestration pour vos projets de données et d'IA et apprenez à choisir le bon outil.

En quoi l’orchestration des processus diffère-t-elle de l’automatisation des processus ?

Bien que l’automatisation et l’orchestration soient très complémentaires, il s'agit de deux concepts différents. L’automatisation consiste à programmer l’exécution d’une tâche sans qu'une intervention humaine ne soit nécessaire. L’orchestration est quant à elle la configuration de plusieurs tâches (dont certaines peuvent être automatisées) en un processus ou job complet de bout en bout. Une solution d’orchestration doit également réagir aux événements ou aux activités tout au long du processus et prendre des décisions basées sur les résultats d’une tâche automatisée, afin de déterminer les prochaines tâches et les coordonner.

Qu’est-ce que l’orchestration d’applications ?

L’orchestration d’applications consiste à intégrer deux ou plusieurs applications ensemble. Vous pouvez le faire pour automatiser un processus ou pour permettre la synchronisation des données en temps réel. La plupart des efforts de développement de logiciels nécessitent une certaine forme d’orchestration d’applications, Sans cela, il est beaucoup plus difficile d'intégrer de nouveaux projets de développement d’applications, d’analytique de données, de machine learning et d’IA.

Ce processus vous permet de gérer et de contrôler vos intégrations de manière centralisée. Il vous permet également d’ajouter des fonctionnalités pour le routage des messages, la sécurité, la transformation et la fiabilité. Cette approche est plus efficace que l’intégration point à point, car la logique d’intégration est dissociée des applications elles-mêmes et gérée au sein d’un conteneur.

Qu’est-ce que l’orchestration des services ?

L’orchestration des services fonctionne de la même manière que l’orchestration d’applications. Elle vous permet en effet de coordonner et de gérer des systèmes à travers plusieurs fournisseurs cloud et plusieurs domaines, ce qui est capital dans le monde d’aujourd’hui. Cette approche englobe l’orchestration des microservices, des réseaux et des workflows.

Les services individuels ne sont pas nativement capables de s’intégrer les uns aux autres, et ils ont tous leurs propres dépendances et exigences. Plus le système est complexe, plus il est important de faire une orchestration de ses différents composantes. De cette façon, vous pouvez faire monter en charge les infrastructures en fonction des besoins, optimiser les systèmes selon les objectifs de l’entreprise et éviter les pannes de prestation de services.

Qu’est-ce que l’orchestration de conteneurs ?

Vous avez déjà probablement rencontré le terme « orchestration de conteneurs » dans le cadre de l’orchestration d’applications et de services. Mais qu’est-ce que l’orchestration de conteneurs au juste, et pourquoi l’utiliser ?

L’orchestration de conteneurs est l’automatisation de la gestion et de la coordination des conteneurs. Les équipes logicielles utilisent les meilleurs outils d’orchestration de conteneurs pour contrôler et automatiser des tâches telles que le provisionnement et les déploiements de conteneurs, l’allocation de ressources entre les conteneurs, leur monitoring et la sécurisation de leurs interactions.

Comment fonctionne l’orchestration de conteneurs ?

En général, les équipes chargées de l’orchestration des logiciels se servent d’outils d’orchestration de conteneurs tels que Kubernetes et Docker Swarm. Tout commence par une description de la configuration de l’application dans un fichier qui indique à l’outil où rassembler les images des conteneurs et comment mettre en réseau les conteneurs.

L’outil planifie également le déploiement des conteneurs dans les clusters et trouve l’hôte le plus approprié en fonction de contraintes prédéfinies telles que les libellés ou les métadonnées. Il gère ensuite le cycle de vie du conteneur en fonction des spécifications définies dans le fichier.

Mais à quoi sert l’orchestration de conteneurs ? Et quel est le but de l’automatisation et de l’orchestration ? Automatiser l’orchestration de conteneurs permet de faire évoluer les applications au moyen d’une seule commande. Cela facilite aussi la création rapide de nouvelles applications conteneurisées pour faire face à l’augmentation du trafic et simplifier le processus d’installation. Qui plus est, cela renforce la sécurité.

Qu’est-ce que l’orchestration cloud ?

L’orchestration cloud est le processus d’automatisation des tâches qui gèrent les connexions sur des clouds privés et publics. Elle intègre également des tâches et des processus automatisés dans un workflow pour vous aider à exécuter certaines fonctions commerciales.

L’essor du cloud computing (privé, public et hybride) a généré encore plus de complexité. D’où la nécessité d’un logiciel d’orchestration cloud capable de gérer et de déployer de multiples dépendances sur plusieurs clouds. L’orchestration des services cloud comprend des tâches telles que le provisionnement des charges de travail des serveurs et de la capacité de stockage. Elle englobe aussi l’orchestration des services, des charges de travail et des ressources.

N’oubliez pas que l’orchestration cloud et l’automatisation des services cloud sont deux choses différentes : l’orchestration cloud porte sur l’ensemble des processus informatiques, tandis que l’automatisation concerne un élément individuel. L’orchestration simplifie l’automatisation dans un environnement multicloud, tout en veillant au respect des politiques et des protocoles de sécurité.

Qu’est-ce que l’orchestration de la sécurité ?

L’orchestration de la sécurité consiste à s’assurer que vos outils de sécurité automatisés peuvent fonctionner ensemble de manière efficace. Elle rationalise également la manière dont ils sont utilisés par les équipes de sécurité. Son but est de faire en sorte que les outils puissent communiquer entre eux et échanger des données. Cela réduit le risque d’erreur humaine, permet aux équipes de mieux répondre aux menaces et permet de gagner du temps et de l’argent.

Qu’est-ce que la SOAR (Security Orchestration, Automation and Response) ? Cet acronyme décrit trois capacités logicielles telles que définies par Gartner :

Orchestration : gestion des menaces et des vulnérabilités
« Automation » : automatisation des opérations de sécurité
« Response » : réponse aux incidents de sécurité

Cette approche combine l’automatisation et l’orchestration. Elle permet aux organisations d’automatiser la détection des menaces, la collecte des informations sur les menaces et les réponses aux incidents pour les menaces de niveau inférieur.

Qu’est-ce qu’une couche d’orchestration ?

Une couche d’orchestration est nécessaire pour coordonner plusieurs services API. Elle vous permet de créer des connexions ou des instructions entre votre connecteur et ceux d’applications tierces. Cela permet en fait de créer une API unique qui fait plusieurs appels à différents services pour répondre à une seule demande d’API.

Elle gère également le formatage des données entre des services distincts, notamment lorsque les demandes et les réponses doivent être divisées, fusionnées ou acheminées. En ajoutant cette couche d’abstraction, vous fournissez à votre API un certain degré d’intelligence pour la communication entre les services. Une couche d’orchestration participe à la transformation des données, à la gestion des serveurs, au traitement des authentifications et à l’intégration des systèmes existants.

Dans le cloud, une couche d’orchestration gère les interactions et les interconnexions entre les composants basés sur le cloud et les composants on-premise. Il s’agit notamment des serveurs, des réseaux, des machines virtuelles, de la sécurité et du stockage.

Qu’est-ce que l’orchestration du parcours ?

Qu’est-ce que l’orchestration du parcours client ? L’orchestration du parcours pousse encore plus loin le concept de cartographie du parcours client. Elle utilise l’automatisation pour personnaliser les parcours en temps réel, au lieu de s’appuyer sur des données historiques. L’objectif reste le même : créer et façonner le parcours idéal du client.

Grâce à l’orchestration des parcours, les entreprises peuvent également faire preuve d’agilité, s’adapter aux changements et repérer les problèmes potentiels avant qu’ils ne surviennent.

Outils d’orchestration

L’orchestration de tâches complexes exige un travail important de la part des équipes data et nécessite des outils spécialisés. Ceux-ci doivent en effet permettre de développer, gérer, surveiller et exécuter efficacement de tels pipelines. Ces outils sont généralement distincts des données proprement dites ou des tâches de machine learning. Ce manque d’intégration entraîne une fragmentation des efforts au sein de l’entreprise et oblige les utilisateurs à changer régulièrement de contexte.

Étant donné que les entreprises multiplient les initiatives dans le domaine de la Business Intelligence (BI) et de l’intelligence artificielle (IA), la demande en outils d’orchestration simples, évolutifs et fiables s’est accrue. Il existe une variété d’outils pour aider les équipes à tirer pleinement parti de l’orchestration grâce à un cadre qui leur permet d’automatiser les charges de travail.

Les outils d’orchestration de services vous aident à intégrer différents systèmes et applications, tandis que les outils d’orchestration cloud permettent de réunir plusieurs systèmes cloud. Les outils d’orchestration permettent également de gérer les processus de bout en bout à partir d’un seul endroit et de simplifier la création de processus pour obtenir des workflows autrement irréalisables.

Databricks vous permet par exemple d’unifier l’entreposage de vos données et de vos cas d’usage de l’IA sur une seule plateforme. Cliquez ici pour savoir comment orchestrer les charges de travail Databricks.

Qu’est-ce que l’orchestration du déploiement d’applications ?

L’orchestration du déploiement d’applications (ARO, pour Application Release Orchestration) permet aux équipes DevOps d’automatiser les déploiements d’applications, de gérer les fonctionnalités d’intégration et de livraison continues (CI/CD) des pipelines, et d’orchestrer le déploiement des workflows. Son but est d’améliorer la qualité, la rapidité et la gouvernance de vos nouveaux déploiements.

En plus de l’automatisation du déploiement et de la gestion des pipelines, les outils d’orchestration du déploiement des applications permettent aux entreprises d’échelonner les activités de déploiement entre plusieurs équipes, technologies, méthodologies et pipelines différents. Parmi les outils ARO les plus connus figurent GitLab, Microsoft Azure Pipelines et FlexDeploy.

Qu’est-ce que l’orchestration des processus ?

Bien que les processus automatisés soient nécessaires à une orchestration efficace, ils présentent le risque de créer des silos à force d’utiliser des outils différents pour chaque tâche individuelle (et de les acquérir auprès de plusieurs fournisseurs). D’où la nécessité d’intégrer vos outils et vos workflows, ce qui revient à orchestrer vos processus.

L’orchestration des processus consiste à unifier les tâches individuelles en processus de bout en bout et à optimiser les intégrations de systèmes à l’aide de connecteurs universels, d’intégrations directes ou d’adaptateurs d’API. Les équipes IT peuvent alors gérer l’ensemble du cycle de vie du processus à partir d’un seul endroit.

Parmi ses avantages : la réduction de la complexité par la coordination et la consolidation d’outils disparates, et l’amélioration du délai moyen de résolution (MTTR) par la centralisation du monitoring et de l’enregistrement des processus. Citons également l’intégration de nouveaux outils et de nouvelles technologies dans une plateforme d’orchestration unique. Ce type d’orchestration des logiciels permet d’intégrer rapidement presque n’importe quel outil ou technologie.

Le rôle des plateformes d’orchestration de données

L’orchestration de données est un processus automatisé qui permet d’extraire des silos de données de plusieurs emplacements de stockage, de les combiner et de les organiser, puis de les rendre disponibles à des fins d’analyse. Ce processus relie tous vos datacenters, qu’il s’agisse de systèmes existants, d’outils basés sur le cloud ou de data lakes. Ces données sont transformées dans un format standard, ce qui permet de mieux les comprendre et de les utiliser plus facilement lors de la prise de décision.

La plupart des entreprises accumulent une quantité phénoménale de données. C’est pourquoi des outils automatisés sont nécessaires pour les organiser. Qu’est-ce que l’orchestration Big Data ? C’est le processus consistant à organiser des données de trop grande taille, trop rapides ou trop complexes pour être traitées par les méthodes traditionnelles. L’orchestration de données permet également d’identifier les « dark data », c’est-à-dire les données qui occupent de l’espace sur un serveur sans jamais être utilisées.

Les plateformes d’orchestration de données sont idéales pour garantir la conformité et détecter les problèmes. Par exemple, une plateforme d’orchestration des paiements vous donne accès aux données client en temps réel, ce qui vous permet de repérer toute transaction à risque.

Qu’est-ce que l’orchestration DevOps ?

L’orchestration DevOps est la coordination des pratiques DevOps de l’ensemble de votre entreprise et des outils d’automatisation utilisés pour les mener à bien. Son but est de minimiser les problèmes de production et de réduire le temps nécessaire à la mise sur le marché des nouvelles versions.

L’orchestration de vos tâches automatisées permet d’optimiser le potentiel de vos outils d’automatisation. Cela nous ramène à la question concernant la différence entre orchestration et automatisation. En résumé, vous pouvez optimiser votre efficacité en automatisant de nombreuses fonctions pour qu’elles s’exécutent en même temps, mais l’orchestration est nécessaire pour s’assurer que ces fonctions interagissent correctement.

Par exemple, l’orchestration DevOps pour un pipeline de déploiement basé sur le cloud vous permet de combiner trois fonctions : le développement, l'assurance qualité et la production.

Qu’est-ce que l’orchestration Docker ?

Docker est un environnement d’exécution de conteneurs convivial qui fournit un ensemble d’outils pour le développement d’applications conteneurisées. Il vous permet de packager votre code dans une image qui est ensuite utilisée pour créer un conteneur. L’orchestration Docker consiste donc en un ensemble de pratiques et de technologies permettant de gérer les conteneurs Docker.

Ce type d’orchestration est nécessaire lorsque vos applications conteneurisées couvrent un grand nombre de conteneurs. Elle est utilisée pour des tâches telles que le provisionnement des conteneurs, la mise à l’échelle, la gestion du réseau et l’équilibrage de charge.

L’écosystème Docker propose plusieurs outils d’orchestration, tels que Swarm. Kubernetes est couramment utilisé pour orchestrer les conteneurs Docker, tandis que les plateformes de conteneurs cloud offrent également des capacités basiques pour l’orchestration.

Orchestrer les pipelines de données et de machine learning dans Databricks

Databricks facilite l’orchestration de tâches multiples, vous permettant de créer facilement des workflows de données et de machine learning.

L’orchestration de tâches à plusieurs étapes permet de définir facilement des pipelines de données et de ML à l’aide de tâches modulaires interdépendantes composées de notebooks, de scripts Python et de fichiers JAR. Les équipes data peuvent facilement créer et gérer des pipelines à plusieurs étapes qui transforment et affinent les données, et entraînent les algorithmes de machine learning, le tout dans le workspace familier de Databricks. Cela permet aux équipes d’économiser énormément de temps, d’efforts et de changements de contexte.

diagramme de flux d'orchestration

Dans l’exemple ci-dessus, nous voyons un job composé de plusieurs tâches. Il utilise deux tâches pour ingérer des données : Clicks_Ingest et Orders_Ingest. Ces données sont ensuite regroupées et filtrées dans la tâche « Match », à partir de laquelle de nouvelles fonctionnalités de machine learning sont générées (Build_Features), rendues persistantes (Persist_Features) et utilisées pour entraîner de nouveaux modèles (Train).

L’orchestration des tâches est entièrement intégrée dans Databricks. Elle ne nécessite aucune infrastructure ou ressource DevOps supplémentaire. Les clients peuvent utiliser l’API Jobs ou l’interface utilisateur pour créer des jobs et des fonctionnalités ainsi que pour les gérer. Il peut s’agir par exemple d'alertes e-mail pour le monitoring.

Votre équipe data n’a pas besoin d’acquérir de nouvelles compétences pour bénéficier de cette fonctionnalité. Cette dernière permet par ailleurs d’orchestrer tout élément doté d’une API en dehors de Databricks et dans toutes les infrastructures cloud, par exemple pour récupérer des données auprès d'applications CRM. Commencez dès maintenant à utiliser la nouvelle orchestration de jobs en l’activant vous-même pour votre workspace (AWS | Azure | GCP).

Ressources complémentaires

Retour au glossaire