Delta Lake
Type de démo
Tutoriel de produit
Durée
À votre rythme
Contenu associé
Qu'allez-vous apprendre ?
Delta Lake est une couche de stockage au format ouvert qui offre fiabilité, sécurité et performances à votre data lake, pour les opérations de streaming mais aussi de batch. En remplaçant les silos par un emplacement unique dédié aux données structurées, semi-structurées et non structurées, Delta Lake constitue la base d'un lake house rentable et hautement évolutif.
Dans cette démo, nous allons vous montrer comment fonctionne Delta Lake et ses principales capacités :
- Transactions ACID
- Support pour DELETE/UPDATE/MERGE
- Unifier batch et streaming
- time travel
- Clone copie zéro
- Partitions générées
- CDF (flux de données modifiées) (DBR runtime)
- Delta 3.0 : Des requêtes ultra-rapides avec Liquid Clustering, créant automatiquement vos partitions sans biais
- Delta 3.0 : Format universel permettant à d'autres formats de lire nativement vos tables Delta Lake, sans verrouillage (Uniforme)
Pour installer la démo, obtenez un espace de travail Databricks gratuit et exécutez les deux commandes suivantes dans un carnet de notes Python.
%pip installez dbdemos
importer dbdemos
dbdemos.install('delta-lake')
Dbdemos est une bibliothèque Python qui installe des démonstrations complètes de Databricks dans vos espaces de travail. Dbdemos chargera et démarrera des carnets de notes, des pipelines Delta Live Tables, des clusters, des tableaux de bord Databricks SQL, des modèles d'entrepôt... Voir comment utiliser dbdemos
Dbdemos est distribué en tant que projet GitHub.
Pour plus de détails, veuillez consulter le GitHub fichier README.md et suivez la documentation.
Dbdemos est fourni en l'état. Voir le Licence et Avis pour plus d'informations.
Databricks n'offre pas de support officiel pour dbdemos et les actifs associés.
Pour tout problème, veuillez ouvrir un ticket et l'équipe de démonstration y jettera un coup d'œil sur une base de meilleurs efforts.