L'un des principaux éléments de Databricks est le Workspace data science qui permet la collaboration entre tous les membres de l'équipe data. L'environnement de notebook collaboratif est utilisé par tous les membres de l'équipe data : data scientists, data analysts, ingénieurs data, etc. Databricks est utilisé dans divers secteurs d'activité pour un ensemble tout aussi vaste de cas d'usage. Cette galerie présente certaines des possibilités offertes par les notebooks pouvant facilement être importés dans votre propre environnement Databricks, ou dans l'édition gratuite de la communauté (CE).
Delta Lake
Créez votre data lakehouse et bénéficiez de transactions ACID, de voyages dans le temps, de contraintes et autres sur des formats de fichiers ouverts
Databricks : 7.6.x – pas CE
Plongée dans Delta Lake
Ceci est une plongée dans Delta Lake, un format de stockage open source qui fournit des transactions ACID à Apache Spark™.
Databricks : 8.0.x
Utilisation de Delta Lake à partir de R
Ceci est une introduction rapide à l'utilisation de Delta Lake, un format de stockage open source qui utilise SparkR.
Machine learning
Prise en charge de frameworks de machine learning populaires tels que TensorFlow, Spark MLlib, Horovod
Databricks : 7.6.x avec GPU – pas CE
Deep learning distribué avec PyTorch et Horovod
Découvrez comment effectuer une formation distribuée de modèles dans PyTorch à l'aide d'Horovod.
Databricks : 8.1.x
Créez une application ML de streaming avec Spark
Créez une application ML de streaming qui surveille les fraudes à la carte de crédit à l'aide de Spark.
Databricks : 7.6.x
Démarrer avec Spark MLlib
Une introduction à l'utilisation de la bibliothèque Spark MLlib pour les applications ML.
Databricks : 7.6.x avec GPU – pas CE
De Spark à TensorFlow : simplifiez la conversion de vos données
Simplifiez la conversion des données de Spark DataFrames en vue d'une utilisation avec TensorFlow.
MLflow
Prise en charge de bout en bout du machine learning : de la formation de vos modèles à leur mise en production
Databricks : 7.6.x
Commencez par l'enregistrement de projets ML avec MLflow
Une introduction à l'API d'enregistrement MLflow pour la gestion de workflows ML.
Databricks : 7.6.x
Démarrage rapide : comment utiliser les API de suivi fluide MLflow
Découvrez comment utiliser les API de suivi fluide de haut niveau dans MLflow.
Databricks : 7.6.x – pas CE
Un exemple de bout en bout de machine learning pour données tabulaires
Ceci est un notebook présentant un exemple de cycle de vie ML de bout en bout pour données tabulaires.
Apache Spark™
Le moteur de calcul distribué qui alimente le data engineering et la data science pour le data lakehouse
Databricks : 8.1.x
Applications de streaming pour données de capteurs
Découvrez comment utiliser le streaming structuré dans Spark pour les applications de données de capteurs.
Databricks : 8.1.x
Analyse des appels pour incendies de San Francisco avec Spark
Utilisez Spark ETL pour analyser les appels destinés aux pompiers de San Francisco.
Databricks : 8.1.x
Interagir avec des sources de données externes à partir de Spark
Une brève introduction sur la façon d'accéder et d'interagir avec des sources de données externes à partir de Spark.
Databricks : 8.1.x
Streaming structuré pour applications en temps réel
Une introduction à la sémantique du streaming structuré dans Spark pour les données en temps réel.
Databricks : 8.0.x – pas CE
Étendre SparkR avec des fonctions définies par l'utilisateur (UDF)
Découvrez comment étendre les fonctionnalités de SparkR grâce à des fonctions personnalisées écrites à l'aide d'UDF dans R.
Cas d’utilisation
Databricks est utilisé dans de nombreux secteurs d'activité, notamment la finance, la vente au détail, les technologies, l'industrie manufacturière, etc.
Databricks : 7.6.x
Analyse de paniers de consommation pour la vente au détail
Ceci est un notebook qui montre comment réaliser une analyse de panier de consommation pour la vente au détail.
Accélérateurs
de solutions
Modèles complets pour l'utilisation de Databricks dans cinq secteurs d'activité différents

