ETL et ELT
Une exploration détaillée de deux approches de traitement des données

Pour bien choisir entre les modèles ETL et ELT lors de la création de pipelines de traitement des données, il faut bien comprendre les rouages de chacun.
Bien mises en œuvre, les deux approches peuvent aider votre organisation à améliorer l'efficacité de ses workflows. Elles présentent toutefois des différences importantes qui méritent qu'on s'y attarde.
Cet article explore dans le détail les points communs et divergences entre ces deux approches de traitement des données, pour vous aider à choisir celle qui convient le mieux à votre activité.
ETL et ELT : vue d'ensemble
ELT et ETL se distinguent essentiellement par l'ordre dans lequel se déroulent les opérations. ETL signifie « extraire, transformer, charger » : les données sont d'abord extraites de leur source, puis converties dans un format utilisable lors d'une étape intermédiaire. Les données utilisables obtenues sont enfin transférées dans un référentiel de stockage où elles pourront servir à des analyses.
Ce modèle est la norme dans le traitement des données depuis plusieurs décennies, tandis que l'ELT, apparu plus récemment, tire parti des capacités des systèmes modernes de stockage.
ELT signifie « extraire, charger, transformer ». Autrement dit, les données sont chargées dès qu'elles sont extraites sans être préalablement transformées. Elles sont ensuite converties dans le format requis directement depuis le référentiel.
L'ELT fonctionne bien avec les architectures data lake modernes, qui accueillent aussi bien des données structurées que non structurées. Les analystes peuvent ainsi puiser dans un éventail plus large de types de données pour produire des insights et des interprétations plus pertinentes.
Malgré tout, le modèle ETL conserve un certain nombre d'avantages. Il est donc tout à fait intéressant de prendre le temps de comprendre en quoi les approches ELT et ETL se ressemblent et divergent.

