Orchestrieren und Ausführen Ihrer dbt-Jobs
Demotyp
Produktanleitung
Laufzeit
Selbststudium
Ähnliche Inhalte
Was Sie lernen werden
dbt ist ein beliebtes Daten-Framework zum Transformieren und Laden von Daten in Ihr Lakehouse. Databricks macht es sehr einfach, produktionsreife dbt-Pipelines mit Ihrem Databricks SQL-Warehouse zu starten.
In dieser dbt und Databricks-Demo werden wir folgendes behandeln:
- Wie man eine dbt-Pipeline erstellt, um Ihre Kundendatensätze zu erfassen. (Wir werden die gleiche Pipeline wie in der 'lakehouse-retail-c360' Demo erstellen).
- Wie Sie Ihre dbt-Pipeline von Ihrer Idee aus starten.
- Und letztendlich, wie Databricks Workflows dbt-Aufgaben starten können, um Ihren Produktionslauf zu orchestrieren.
Hinweis: Diese Demo wird für Sie das Repo
https://github.com/databricks-demos/dbt-databricks-c360 in Ihrem persönlichen Repo-Ordner klonen.
Um die Demo zu installieren, besorgen Sie sich eine kostenlose Databricks-Arbeitsumgebung und führen Sie die folgenden zwei Befehle in einem Python-Notebook aus.
%pip installieren Sie dbdemos
importiere dbdemos
dbdemos.installiere('dbt-on-databricks')
Dbdemos ist eine Python-Bibliothek, die vollständige Databricks-Demos in Ihren Arbeitsbereichen installiert. Dbdemos lädt und startet Notebooks, Delta Live Tables-Pipelines, Cluster, Databricks SQL-Dashboards, Warehouse-Modelle ... Sehen Sie wie man dbdemos verwendet
Dbdemos wird als GitHub-Projekt bereitgestellt.
Für weitere Details, bitte das GitHub README.md Dokument einsehen und der Dokumentation folgen.
Dbdemos wird so bereitgestellt, wie es ist. Siehe die Lizenz und Hinweis für weitere Informationen.
Databricks bietet keine offizielle Unterstützung für dbdemos und die zugehörigen Assets.
Bei Problemen, bitte ein Ticket öffnen und das Demo-Team wird sich nach bestem Bemühen darum kümmern.