Comprendre les distinctions fondamentales et la place de chacun au sein de l'IA.
Dans le monde plus vaste de l'intelligence artificielle (IA), les concepts de machine learning et d'apprentissage profond sont souvent confondus. L'IA est le vaste domaine de la construction de systèmes intelligents qui effectuent des tâches nécessitant une prise de décision de type humain. Machine learning (ML) est un type d'IA où les systèmes apprennent des modèles à partir de données historiques afin de prendre des décisions sans être explicitement programmés pour chaque règle. Le deep learning (DL) est un sous-ensemble spécialisé du machine learning qui utilise des réseaux de neurones multicouches pour apprendre automatiquement à partir de grands datasets afin de résoudre des problèmes complexes de perception et de langage.
La hiérarchie suivante explique la relation entre l'IA, le ML et le DL :
Intelligence Artificielle (IA) Règles et logique
└── Machine Learning (ML) remplace les règles par l'expérience
└── Apprentissage profond (DL) apprentissage automatique
Le ML et le DL sont des approches permettant de réaliser l'IA. En fait, la plupart des produits d'IA actuels sont en réalité des systèmes de ML, des modèles de deep learning ou des pipelines de données basés sur le ML.
| Aspect | AI | ML | DL |
|---|---|---|---|
| Technique | Règles, logique, recherche | Modèles statistiques | Réseau de neurones |
| Exigences en matière de données | datasets de petite à moyenne taille | datasets de petite à moyenne taille | Très grands datasets |
| Apprentissage requis | Pas toujours | Toujours | Toujours |
| Adaptabilité | Souvent statiques | S'améliore avec plus de données | S'améliore avec plus de données |
| Besoins en compute | Faible à modéré | Modéré | Haute |
| Idéal pour | Raisonnement, contrôle | Données structurées | Données non structurées |
| Exemples | Planification, prise de décision | Recommandations | Vision, parole, langage |
Machine learning permet à un ordinateur d'apprendre des motifs à partir de données, puis d'utiliser ces motifs pour faire des prédictions ou prendre des décisions. Il s'améliore avec l'expérience, sans programmation explicite. Les données sont le carburant du ML. Tout start par un problème ou une question à laquelle vous voulez que le système réponde. Il utilise ensuite les données collectées et normalisées dans un modèle (un algorithme qui fait correspondre des entrées à des sorties). Chaque modèle a des paramètres appris à partir des données et des hyperparamètres choisis par des humains.
Les modèles de ML courants incluent :
Les modèles de machine learning apprennent les motifs plus efficacement grâce au feature engineering, un processus de transformation des données brutes en signaux utiles pour un modèle. Une caractéristique est une variable d'entrée (numérique, catégorielle, date/heure, texte) utilisée par un modèle. De bonnes caractéristiques peuvent améliorer la précision, l'interprétabilité et réduire le temps d'entraînement.
L'apprentissage profond est une approche de ML qui utilise des réseaux de neurones artificiels multicouches pour apprendre automatiquement des motifs complexes à partir de grandes quantités de données. On les appelle réseaux de neurones, car ils imitent la structure neuronale du cerveau humain. C'est l'une des approches les plus puissantes pour créer des systèmes d'IA.
Avec le deep learning, les humains ne conçoivent pas les caractéristiques à partir desquelles apprendre. Les modèles apprennent les représentations directement à partir des données brutes en utilisant de nombreuses couches de réseaux de neurones. Les couches construisent une hiérarchie de caractéristiques et comprennent une couche d'entrée, plusieurs couches cachées et une couche de sortie. Chaque couche applique des poids, ajoute un biais et passe par une activation non linéaire.
Le ML et le DL relèvent tous deux de l'IA et sont étroitement liés, car le deep learning est un sous-ensemble du machine learning. Ils partagent de nombreux principes fondamentaux, workflows et objectifs. Tous deux apprennent des motifs à partir des données et visent à faire des prédictions ou à prendre des décisions sur la base de ces données.
Lorsqu'ils apprennent à partir de données, les deux peuvent améliorer leurs performances à mesure qu'ils reçoivent plus de données dans un processus d'apprentissage itératif. Et les deux peuvent généraliser à partir de ces données pour de nouvelles données, jamais vues auparavant. Le ML et le DL requièrent tous deux un entraînement sur des données historiques, une validation pour ajuster les paramètres et des tests sur des données nouvelles.
Et tous deux peuvent être appliqués à des problèmes de classification, de régression et de clusters.
Bien que le machine learning et l'apprentissage profond présentent de nombreuses similitudes, ils ont des exigences différentes en matière de données et d'efforts d'ingénierie des caractéristiques. Le ML fonctionne souvent bien avec des datasets structurés de petite à moyenne taille, mais ses performances dépendent de la qualité des caractéristiques, ce qui nécessite une ingénierie des caractéristiques dirigée par l'homme pour identifier les variables pertinentes.
Le DL dépend de grandes quantités de données non structurées (images, texte, audio) et l'échelle des exemples a un impact direct sur les performances, car le DL effectue une extraction automatique des caractéristiques avec une intervention humaine minimale.
La connaissance du domaine et la qualité des caractéristiques sont essentielles en ML, tandis qu'avec le DL, les modèles apprennent les caractéristiques en interne, si bien que l'échelle des données et l'infrastructure deviennent plus importantes.
Il est utile de comparer les besoins en compute et le temps d'entraînement nécessaires pour le ML et le DL, car ce sont les facteurs qui affectent le plus le coût, la vitesse d'itération et la faisabilité de vos systèmes en tant que produits. Les modèles de ML traditionnels peuvent fonctionner sur des processeurs (CPU) standards avec une mémoire plus faible, tandis que le DL nécessite des processeurs graphiques (GPU) ou des TPU avec une mémoire élevée pour un entraînement efficace. Les coûts d'infrastructure seront donc plus élevés avec le DL.
Les modèles de ML s'entraînent rapidement, ce qui permet des itérations et des expérimentations rapides, tandis que les modèles de DL nécessitent des temps d'entraînement plus longs en raison de leurs architectures complexes et multicouches. Le coût d'entraînement, l'infrastructure, l'énergie et la complexité sont donc plus élevés avec le DL, mais le ML peut ne pas être performant pour les problèmes à grande échelle.
D'autres facteurs à prendre en compte lors de la comparaison entre le machine learning et l'apprentissage profond sont l'interprétabilité (la facilité avec laquelle un humain peut comprendre pourquoi un modèle a fait une prédiction) et la transparence (la visibilité et l'explicabilité de la logique interne et du processus de décision du modèle).
Les modèles de ML sont conçus pour être transparents et souvent plus interprétables. Ils montrent l'importance des caractéristiques et permettent un raisonnement étape par étape. Par exemple : les règles si-alors des arbres de décision sont lisibles par l'homme, les coefficients de régression linéaire montrent l'impact direct des caractéristiques et les odds ratios de la régression linéaire expliquent leur influence.
Les modèles de DL agissent davantage comme des "boîtes noires" du point de vue de la transparence. Ils ne reposent pas sur des règles explicites ou des caractéristiques conçues par l'homme. Ils contiennent des millions de paramètres et apprennent des représentations hiérarchiques et distribuées, ce qui rend difficile la compréhension des caractéristiques qui sont à l'origine d'une prédiction.
L'interprétabilité est importante pour l'audit et devient essentielle dans les Secteurs d'activité réglementés tels que la santé, la finance et le droit, où des décisions à fort enjeu sont prises régulièrement et où la confiance est primordiale.
En règle générale, il est conseillé d'utiliser le ML lorsqu'un problème bien défini implique des motifs dans les données qui sont difficiles à définir avec des règles fixes, mais où l'apprentissage profond serait inutile ou inefficace. Le ML est bien adapté lorsque les données sont structurées et que le dataset est de taille petite à moyenne, comme c'est le cas pour les données d'entreprise (prévisions des Ventes, métriques financières, dossiers clients).
Le ML est efficace lorsque le budget de compute est limité et qu'une itération rapide est importante (détection de la fraude, évaluation du crédit), ainsi que pour les applications où l'interprétabilité et l'explicabilité sont requises (finance, santé, assurance, droit).
Le DL peut exceller dans la résolution de problèmes qui impliquent des modèles complexes dans de grandes quantités de données diverses et non structurées, lorsque vous disposez de GPU/TPU et du temps nécessaire pour le prendre en charge. Le DL est le plus adapté aux entrées difficiles à modéliser avec le ML traditionnel (images, vidéo, audio). Le DL est nécessaire lorsque la conception manuelle de caractéristiques est difficile ou impossible, mais que les données brutes contiennent des signaux utiles. Le DL est également approprié lorsque la précision est plus importante que l'interprétabilité et le coût, et que le système peut tolérer des cycles d'entraînement plus longs.
Le DL est particulièrement efficace lorsque l'apprentissage par transfert est disponible à partir de modèles pré-entraînés (reconnaissance d'images et d'objets) et que le problème implique la perception ou le langage (vision par ordinateur, reconnaissance vocale, traitement du langage naturel, véhicules autonomes et robotique).
ChatGPT, est-ce de l'IA ou du ML ? La réponse est : les deux !
N'oubliez pas que le ML et le DL sont deux types d'IA, et que le DL est un sous-ensemble du ML. En fait, ChatGPT est un modèle de deep learning construit avec un très grand réseau de neurones de type transformer. GPT (Generative Pre-trained Transformer) est composé de millions à des milliards de paramètres et de quantités massives de données d'entraînement.
Les systèmes de création d'images populaires comme DALL-E et Midjourney sont des modèles de diffusion construits à l'aide de réseaux de neurones profonds. Ils entrent donc tous deux dans la catégorie du DL. Les deux nécessitent un entraînement à grande échelle pour créer des images à partir d'invites textuelles, des calculs intensifs et un apprentissage de la représentation.
Lorsque Netflix ou Spotify font des recommandations, ils utilisent une combinaison de modèles de ML traditionnels et de modèles de DL qui fonctionnent ensemble. Ces systèmes analysent le comportement de l'utilisateur, les attributs du contenu et les similitudes entre les deux pour décider quel contenu afficher, dans quel ordre et à quels utilisateurs. Le ML est utilisé pour le classement, la personnalisation et les tests A/B. Le DL est utilisé pour modéliser les goûts des utilisateurs, comprendre le contenu et apprendre les relations utilisateur-élément à grande échelle.
Voici à quoi ressemblent ces produits dans la hiérarchie du système d'IA :
Intelligence Artificielle (IA)
└── Machine Learning (ML)
└── Modèles de filtrage collaboratif (Netflix/Spotify)
└── Apprentissage profond (DL)
└── Modèles de diffusion (DALL·E, Midjourney)
└── Modèles Transformer (ChatGPT/GPT, Netflix/Spotify)
Taille du dataset :
Petit/structuré = ML
Grand/non structuré = DL
Besoin d'interprétabilité
Élevé = ML
Faible = Le DL est acceptable
Ressources de calcul disponibles
Limitées = ML
Robustes = DL possible
Type de problème
Données tabulaires = ML
Images/texte/audio = DL
Voici une feuille de route d'apprentissage pratique, qui commence par quelques principes fondamentaux partagés, puisque le DL s'appuie sur les principes fondamentaux du ML. Gardez également à l'esprit que votre parcours spécifique dépend du problème particulier à résoudre et des ressources disponibles pour votre système.
Fondamentaux communs :
Parcours Machine Learning :
Parcours Deep Learning :
N'oubliez pas que le DL s'appuie sur les principes fondamentaux du ML, alors commencez par les bases du ML quel que soit votre objectif final.
L'apprentissage automatique et l'apprentissage profond sont deux approches pour réaliser l'IA, en fonction de vos exigences en matière de données, de vos demandes de calcul, de vos besoins en interprétabilité et de vos cas d'utilisation.
Les cas d'utilisation du ML sont caractérisés par des datasets structurés, tabulaires et plus petits. Ils ont souvent des besoins élevés en matière d'interprétabilité/explicabilité et des exigences de calcul et de temps plus faibles.
Les cas d'utilisation du DL impliquent des motifs complexes, de grandes quantités de données diverses et non structurées, et la précision y est plus importante que l'interprétabilité. Un investissement en temps et une infrastructure de compute beaucoup plus importants sont nécessaires pour l'entraînement des modèles de DL.
Le meilleur choix dépend de votre problème spécifique et des ressources disponibles. Sachez que ces deux technologies continuent d'évoluer, avec des architectures de modèles plus robustes utilisant moins de mémoire, un entraînement plus efficace, ainsi qu'une évaluation et des tests améliorés. On observe une convergence croissante dans l'IA, où le ML, le DL et les règles sont combinés dans des systèmes hybrides. Les nouvelles applications et les exigences en matière de réglementation et de gouvernance influenceront également la manière dont les modèles sont créés et déployés.
Le ML ne remplace pas le DL. Les deux continuent d'évoluer côte à côte.
