Eine Kernkomponente von Databricks ist der Data Science Workspace, der die Zusammenarbeit zwischen allen Mitgliedern des Datenteams ermöglicht. Die kollaborative Notebook-Umgebung wird von allen Mitgliedern des Datenteams genutzt: Data Scientists, Datenanalysten, Data Engineers und anderen. Databricks wird von einer Vielzahl von Branchen für eine ebenso breite Palette von Anwendungsfällen verwendet. Diese Galerie zeigt einige der Möglichkeiten von Notebooks, die leicht in Ihre eigene Databricks-Umgebung oder die kostenlose Community Edition (CE) importiert werden können.
Delta Lake
Bauen Sie Ihr Data Lakehouse auf und nutzen Sie ACID-Transaktionen, Zeitreisen, Einschränkungen und mehr für offene Dateiformate
Databricks: 7.6.x – nicht CE
Vertiefende Beschreibung von Delta Lake
Dies ist eine vertiefende Beschreibung von Delta Lake, einem Open-Source-Speicherformat, das Apache Spark™ mit ACID-Transaktionen erweitert.
Databricks: 8.0.x
Verwendung von Delta Lake aus R
Dies ist eine kurze Grundlageneinführung in die Verwendung von Delta Lake, einem Open-Source-Speicherformat, mit SparkR.
Machine Learning
Unterstützung für gängige Frameworks für Machine Learning wie TensorFlow, Spark MLlib und Horovod
Databricks: 7.6.x mit GPU – nicht CE
Verteiltes Deep Learning mit PyTorch und Horovod
Lernen Sie, wie Sie verteiltes Training von Modellen in PyTorch mit Horovod durchführen können.
Databricks: 8.1.x
Erstellen einer Streaming-ML-Anwendung mit Spark
Erstellen Sie eine Streaming-ML-Anwendung, die Kreditkartenbetrug mit Spark überwacht.
Databricks: 7.6.x
Erste Schritte mit Spark MLlib
Eine Einführung in die Verwendung der Spark MLlib-Bibliothek für ML-Anwendungen.
Databricks: 7.6.x mit GPU – nicht CE
Von Spark zu TensorFlow: Vereinfachen Ihrer Datenkonvertierung
Vereinfachen Sie die Konvertierung von Daten aus Spark DataFrames zur Verwendung mit TensorFlow.
MLflow
End-to-End-Unterstützung für Machine Learning: vom Training Ihrer Modelle bis zu deren Überführung in die Produktion
Databricks: 7.6.x
Erste Schritte mit der Protokollierung für ML-Projekte mit MLflow
Eine Einführung in die MLflow-Protokoll-API für das ML-Workflow-Management.
Databricks: 7.6.x
Kurzanleitung: Verwenden von MLflow-APIs für fließendes Tracking
Erfahren Sie, wie Sie die High-Level-APIs für fließendes Tracking in MLflow nutzen können.
Databricks: 7.6.x – nicht CE
Ein End-to-End-Beispiel für Machine Learning für Tabellendaten
Dies ist ein Notebook, das ein Beispiel für einen durchgängigen ML-Lebenszyklus für tabellarische Daten zeigt.
Apache Spark™
Die Engine für verteiltes Computing, die Data Engineering und Data Science für das Data Lakehouse unterstützt
Databricks: 8.1.x
Streaming-Anwendungen für Sensordaten
Erfahren Sie, wie Sie Structured Streaming in Spark für Sensordatenanwendungen nutzen.
Databricks: 8.1.x
Analyse der Anrufe bei der Feuerwehr von San Francisco mit Spark
Sehen Sie, wie Spark ETL verwendet wird, um die Anrufe bei der Feuerwehr von San Francisco zu analysieren.
Databricks: 8.1.x
Interagieren mit externen Datenquellen aus Spark
Eine kurze Einführung in den Zugriff auf und die Interaktion mit externen Datenquellen aus Spark.
Databricks: 8.1.x
Structured Streaming für Echtzeitanwendungen
Eine Einführung in die Semantik von Structured Streaming in Spark für Echtzeitdaten.
Databricks: 8.0.x – nicht CE
Erweitern von SparkR mit benutzerdefinierten Funktionen (UDFs)
Erfahren Sie, wie Sie die Möglichkeiten von SparkR durch benutzerdefinierte Funktionen erweitern können, die mit UDFs in R geschrieben wurden.
Anwendungsfälle
Databricks wird in vielen Branchen eingesetzt, darunter Finanzen, Einzelhandel, Technologie, Fertigung und mehr.
Databricks: 7.6.x
Warenkorbanalyse für den Einzelhandel
Dies ist ein Notebook, das zeigt, wie man Warenkorbanalysen für den Einzelhandel durchführt.
Lösungs-
beschleuniger
Vollständige Vorlagen für den Einsatz von Databricks in fünf verschiedenen Branchen

