STOCKAGE LAKEHOUSE

Conçu pour le stockage de données ouvert et intelligent

Choisissez votre emplacement de stockage et votre format, et conservez la propriété et la portab

LES MEILLEURES ÉQUIPES RÉUSSISSENT AVEC LA DATA INTELLIGENCE

Votre guide compact de l'analytique moderne

Votre guide essentiel pour fournir une analytique moderne et fiable pour l'AI sur la Databricks Platform

Avantages

Stockage Lakehouse qui est flexible et rapide

Éliminez les maux de tête liés à la gestion des données avec des formats de table ouverts, une gouvernance centralisée et des optimisations de données automatiques.

Formats compatibles

Une seule copie des données sources dans Delta Lake ou Apache Iceberg™ qui peut être accessible par n'importe quel moteur.

Gouvernance unifiée

Un seul catalogue pour la découverte de données et la gouvernance, à travers vos données et vos actifs d'IA.

L'IA au service de la performance

Les modèles alimentés par l'IA optimisent et maintiennent automatiquement les données pour une vitesse et un coût faibles.

Fonctionnalités

Vos données, à votre manière

Choisissez l'emplacement de stockage et le format ouvert qui vous convient. Gardez vos données portables, sans être verrouillé par un fournisseur.

Performance de lecture et d'écriture de premier ordre pour les tables Delta Lake et Apache Iceberg™, prêtes à l'emploi, avec des optimisations de stockage non disponibles dans n'importe quel autre lakehouse.

Plus sur les tables gérées

Accédez aux tables gérées par des catalogues externes comme Glue, HMS et Snowflake Horizon et tirez parti des fonctionnalités avancées du Catalogue Unity comme les contrôles d'accès à granularité fine.

Plus sur les tables étrangères

Unity Catalog architecture with client connections

Les API de catalogue REST Unity et Iceberg débloquent tout l'écosystème de la maison du lac, à travers différents formats et moteurs.

Plus d'informations sur l'utilisation de systèmes externes

Unity Catalog architecture with connected clients

Autres fonctionnalités

Transactions ACID

Les garanties d'atomicité, de cohérence, d'isolation et de durabilité fournies par les protocoles de format de table ouverte.

Optimisation prédictive

Des optimisations pilotées par l'IA en fonction de vos données et de vos modèles d'utilisation pour des tables constamment optimisées.

Clustering fluide

Une disposition de données auto-ajustable et prête à l'emploi qui évolue avec vos données, sans aucune partition.

Flux de Données Modifiées

Suivez les modifications au niveau des lignes entre les versions d'une table Delta.

Voyage dans le Temps

Les informations historiques sur les tables vous permettent d'auditer les opérations, d'annuler une table ou d'interroger une table à un moment précis.

streaming structuré

Intégration avec Apache Spark™ Structured Streaming, un moteur de traitement quasi en temps réel qui offre une tolérance aux pannes de bout en bout avec des garanties de traitement une seule fois.

Cas d’utilisation

Pour toutes vos charges de travail analytiques et d'IA

Construire et gérer des pipelines de données fiables

Les tables gérées agissent à la fois comme des tables de lots et une source et un puits de streaming. L'ingestion de données en streaming, le remplissage historique par batch et les requêtes interactives fonctionnent sans aucun effort supplémentaire, s'intégrant directement à Spark Structured Streaming.

Exécutez des analyses et des charges de travail de BI directement sur votre lac de données

Delta Lake vous permet d'exploiter une architecture lakehouse multicloud qui offre des performances d'entreposage de données à des coûts proches de ceux des data lakes, pour un rapport prix / performance jusqu'à quatre fois meilleur pour les tâches SQL que les data warehouses classiques dans le Cloud.

Explorez les démonstrations de Delta Lake

Voir toutes les démos

Didacticiel

Delta Lake

Reading Unity Catalog Tables in Snowflake

Démo

Lire les tables du Catalogue Unity dans Snowflake

Delta Lake 3.0: UniForm and Liquid Clustering

Visite guidée

Delta Lake 3.0 : UniForm et Liquid Clustering

Didacticiel

Pipeline CDC avec Delta

Produits connexes

Découvrez, gérez et partagez vos données et vos actifs d'IA

Découvrez comment la Databricks Data Intelligence Platform donne du pouvoir à vos équipes data sur l'ensemble de vos charges de travail de données et d'IA.

Unity Catalog

Directement intégré à la Data Intelligence Platform de Databricks, c'est la seule solution de gouvernance ouverte et unifiée pour les données et l'IA.

Delta Sharing

La première approche open source pour le partage de données à travers les données, l'analytique et l'IA. Partagez en toute sécurité des données en direct à travers des plateformes, des nuages et des régions.

Data Intelligence Platform

Explorez tout l'éventail des outils disponibles sur la Databricks Data Intelligence Platform pour intégrer les données et l'IA de toute votre organisation de façon fluide et transparente.