Open-Source

Einige der weltweit beliebtesten Open-Source-Datentechnologien wurden ursprünglich von Databricks-Ingenieuren erfunden

An einem Treffen teilnehmen
Hintergrundbild

Unsere beliebtesten Open-Source-Projekte

Symboltitel
Apache Spark™
Apache Spark ist eine vereinheitlichte Engine zum Ausführen von Data-Engineering-, Data-Science- und ML-Workloads.

Was ist Apache Spark? →

Spark und Databricks im Vergleich →

spark.apache.org besuchen →

Symboltitel
Delta Lake
Mit Delta Lake können Sie eine Lakehouse-Architektur auf Speichersysteme wie AWS S3, ADLS, GCS und HDFS aufsetzen.

Weitere Informationen zu Delta Lake →

delta.io besuchen →

Tech Talks: Erste Schritte mit Delta Lake →

Symboltitel
MLflow
MLflow verwaltet den ML-Lebenszyklus, einschließlich Experimente, Reproduzierbarkeit, Implementierung und einer zentralen Modellregistrierung.

Managed MLflow auf Databricks →

mlflow.org besuchen →

Tech Talks: Den ML-Lifecycle verwalten →

Symboltitel
Redash
Mit Redash kann wirklich jeder Anwender SQL nutzen, um Daten aus großen und kleinen Datenquellen zu untersuchen, abzufragen, zu visualisieren und zu teilen.

Redash auf GitHub besuchen →

Symboltitel
Delta-Freigabe
Delta Sharing ist das branchenweit erste offene Protokoll für die sichere Datenfreigabe. Mit Delta Sharing wird der Datenaustausch mit anderen Organisationen zum Kinderspiel.

Delta-Freigabe besuchen →

Databricks unterstützt außerdem die folgenden beliebten Open-Source-Technologien

Symboltitel
TensorFlow
Databricks unterstützt TensorFlow, eine Bibliothek für Deep Learning und allgemeine Berechnungen auf Clustern

TensorFlow auf Databricks →

Symboltitel
PyTorch™
PyTorch-Schöpfer Facebook und Databricks entwickeln gemeinsam Integrationen

PyTorch auf Databricks →

Symboltitel
Keras™
In Python geschriebene Deep-Learning-API, die auf TensorFlow aufbaut. Verfügbar in Databricks Runtime für Machine Learning.

Keras auf Databricks →

Symboltitel
RStudio
Eine Sammlung von Open-Source-Tools für kollaborative Data Science mit R

R-Programmierung für Big Data →

Symboltitel
Scikit-learn
Weit verbreitetes Python-Paket für maschinelles Lernen, das auf NumPy, SciPy und Matplotlib aufbaut

Scikit-learn auf Databricks →

Symboltitel
XGBoost
Eine verteilte Gradient-Boosting-Bibliothek mit Bindungen in Sprachen wie Python, R und C++

XGBoost auf Databricks →

Symboltitel
Terraform
HashiCorp Terraform ist ein beliebtes Open-Source-Tool zum Erstellen einer sicheren und vorhersehbaren Cloud-Infrastruktur für mehrere Cloud-Anbieter. Der Terraform-Anbieter von Databricks ermöglicht es Kunden, ihre gesamten Databricks-Arbeitsbereiche zusammen mit dem Rest ihrer Infrastruktur mit einem flexiblen, leistungsstarken Tool zu verwalten. Die Verwendung von Terraform bringt Kunden auch dazu, bewährte Methoden mit Infrastructure as Code (IaC) zu übernehmen.

Terraform on Databricks →

Kann's
losgehen?