Open-Source
Einige der weltweit beliebtesten Open-Source-Datentechnologien wurden ursprünglich von Databricks-Ingenieuren erfunden
An einem Treffen teilnehmenUnsere beliebtesten Open-Source-Projekte
Apache Spark™
Apache Spark ist eine vereinheitlichte Engine zum Ausführen von Data-Engineering-, Data-Science- und ML-Workloads.
Delta Lake
Mit Delta Lake können Sie eine Lakehouse-Architektur auf Speichersysteme wie AWS S3, ADLS, GCS und HDFS aufsetzen.
MLflow
MLflow verwaltet den ML-Lebenszyklus, einschließlich Experimente, Reproduzierbarkeit, Implementierung und einer zentralen Modellregistrierung.
Redash
Mit Redash kann wirklich jeder Anwender SQL nutzen, um Daten aus großen und kleinen Datenquellen zu untersuchen, abzufragen, zu visualisieren und zu teilen.
Delta-Freigabe
Delta Sharing ist das branchenweit erste offene Protokoll für die sichere Datenfreigabe. Mit Delta Sharing wird der Datenaustausch mit anderen Organisationen zum Kinderspiel.
Databricks unterstützt außerdem die folgenden beliebten Open-Source-Technologien
TensorFlow
Databricks unterstützt TensorFlow, eine Bibliothek für Deep Learning und allgemeine Berechnungen auf Clustern
PyTorch™
PyTorch-Schöpfer Facebook und Databricks entwickeln gemeinsam Integrationen

Keras™
In Python geschriebene Deep-Learning-API, die auf TensorFlow aufbaut. Verfügbar in Databricks Runtime für Machine Learning.
RStudio
Eine Sammlung von Open-Source-Tools für kollaborative Data Science mit R
Scikit-learn
Weit verbreitetes Python-Paket für maschinelles Lernen, das auf NumPy, SciPy und Matplotlib aufbaut
XGBoost
Eine verteilte Gradient-Boosting-Bibliothek mit Bindungen in Sprachen wie Python, R und C++
Terraform
HashiCorp Terraform ist ein beliebtes Open-Source-Tool zum Erstellen einer sicheren und vorhersehbaren Cloud-Infrastruktur für mehrere Cloud-Anbieter. Der Terraform-Anbieter von Databricks ermöglicht es Kunden, ihre gesamten Databricks-Arbeitsbereiche zusammen mit dem Rest ihrer Infrastruktur mit einem flexiblen, leistungsstarken Tool zu verwalten. Die Verwendung von Terraform bringt Kunden auch dazu, bewährte Methoden mit Infrastructure as Code (IaC) zu übernehmen.
Kann's
losgehen?

