Machine learning
Accélérez vos projets d'IA grâce à une approche du machine learning axée sur les données
Plongez dans le machine learning sur Databricks

Basée sur une architecture ouverte de lakehouse, Databricks Machine Learning permet aux équipes en charge du ML de préparer et de traiter les données, de rationaliser la collaboration à travers l'entreprise et de standardiser l'ensemble du cycle de vie du ML, depuis l'expérimentation jusqu'à la production.

Plus de 6 millions de dollars d'économies
CONA Services utilise Databricks pour un cycle de vie ML complet afin d'optimiser la Supply Chain pour des centaines de milliers de magasins.

3,9 millions de R$ d'économies
Via s'appuie sur l'apprentissage automatique pour prévoir avec précision la demande, réduisant ainsi les coûts de calcul de 25 %.

Plus de 50 millions de dollars de réduction des coûts
Amgen améliore la collaboration en matière de science des données pour accélérer la découverte de médicaments et réduire les coûts opérationnels.
.png)
Simplifier toutes les données pour le ML
Puisque Databricks ML repose sur une base ouverte de lakehouse grâce à Delta Lake, vous permettez à vos équipes de ML d'accéder à tout type de données, de les explorer et de les préparer et ce, à n'importe quelle échelle. Transformez des fonctionnalités en pipelines de production disponibles en libre-service sans dépendre du support de l'ingénierie des données.

Automatiser le suivi et la gouvernance des expériences
Managed MLflow suit automatiquement les paramètres de vos tests et journaux, les métriques, le contrôle de versions des données et du code, ainsi que les artefacts de modèle à chaque exécution d'entraînement. Vous pouvez rapidement voir les exécutions précédentes, comparer les résultats et reproduire un résultat précédemment obtenu selon vos besoins. Une fois que vous avez identifié la meilleure version d'un modèle pour la production, enregistrez-la dans le registre des modèles pour simplifier les transferts tout au long du cycle de déploiement.

Gérez l'intégralité du cycle de vie des modèles, des données à la production – et inversement.
Une fois que les modèles entraînés sont enregistrés, vous pouvez les gérer de manière collaborative tout au long de leur cycle de vie à l'aide du registre des modèles. Les modèles peuvent être versionnés et passer par différentes étapes, comme l'expérimentation, la pré-production, la production et l'archivage. La gestion du cycle de vie s'intègre aux workflows d'approbation et de gouvernance selon des contrôles d'accès basés sur les rôles. Les commentaires et les notifications par e-mail offrent un environnement de collaboration riche aux équipes chargées des données.

Déployer des modèles de ML à faible latence et à grande échelle
Déployez des modèles en un seul clic sans vous inquiéter de la gestion des serveurs ou des contraintes d'échelle. Avec Databricks, vous pouvez déployer vos modèles en tant que points de terminaison d’API REST n’importe où. Et toujours avec une disponibilité de niveau entreprise.
Les composants du produit

Notebooks collaboratifs
Les notebooks Databricks prennent nativement en charge Python, R, SQL et Scala. Les utilisateurs peuvent ainsi travailler avec les langages et bibliothèques de leur choix pour extraire, visualiser et partager des informations.

Runtime de machine learning
Accès en un clic à des clusters ML préconfigurés, optimisés et basés sur une distribution évolutive et fiable des frameworks ML les plus populaires (tels que PyTorch, TensorFlow et scikit-learn), avec des optimisations intégrées pour des performances inégalées dans toute l'entreprise.

Magasin de fonctionnalités
Facilitez la réutilisation des fonctionnalités grâce à une recherche de fonctionnalités basée sur le lignage de données exploitant les sources de données enregistrées automatiquement. Rendez vos fonctionnalités disponibles pour l'apprentissage grâce à un déploiement de modèle simplifié ne nécessitant pas de modification de l'application client.

AutoML
Offrez à chacun, des experts du ML aux data scientists, une approche « Glass box » de l'AutoML fournissant non seulement le modèle le plus performant mais générant aussi un code qui sera par la suite affiné par des experts.

Mlflow administré
Conçu à partir de MLflow - la première plateforme open source au monde pour le cycle de vie du ML - Managed MLflow aide les modèles ML à passer rapidement de la phase de test à la production, avec un haut niveau de sécurité, de fiabilité et d'évolutivité à l'échelle de l'entreprise.

Mise à disposition de modèles de niveau production
Diffusez des modèles à n'importe quelle échelle et en un clic grâce à l'option de calcul serverless.

Supervision des modèles
Surveillez les performances des modèles et leur incidence sur les indicateurs de l’entreprise en temps réel. Databricks offre une visibilité et une traçabilité de bout en bout, des modèles en production aux systèmes de données source. La plateforme permet d'analyser le modèle et la qualité des données tout au long du cycle de vie du machine learning, et donc d'identifier les problèmes avant qu'ils n'aient un impact.

Référentiels
Repos permet aux ingénieurs de suivre les workflows Git dans Databricks. Ainsi, les équipes data peuvent exploiter les workflows de CI / CD automatisés et la portabilité du code.