Azure Databricks ist ein Microsoft-Dienst erster Klasse, der nativ in das Azure-Ökosystem integriert ist, um Daten und KI mit Hochleistungsanalysen und umfassender Tool-Unterstützung zu vereinheitlichen. Diese enge Integration umfasst jetzt eine native Databricks Job-Aktivität in Azure Data Factory (ADF), die es einfacher als je zuvor macht, Databricks Workflows direkt in ADF auszulösen.
Diese neue Aktivität in ADF ist eine sofortige Best Practice, und alle ADF- und Azure Databricks-Benutzer sollten in Erwägung ziehen, zu diesem Muster zu wechseln.
Die neue Databricks Job-Aktivität ist sehr einfach zu bedienen:

3. Wählen Sie auf der Registerkarte Einstellungen in der Dropdown-Liste „Job“ einen Databricks Workflow aus, der ausgeführt werden soll (Sie sehen nur die Jobs, auf die Ihr authentifizierter Principal Zugriff hat). Konfigurieren Sie im Abschnitt „Job-Parameter“ unten die Job-Parameter (falls vorhanden), die an den Databricks Workflow gesendet werden sollen. Weitere Informationen zu Databricks Job-Parametern finden Sie in der Dokumentation.

Das war's schon. ADF startet Ihren Databricks Workflow und gibt die Job Run ID und URL zurück. ADF prüft dann, ob der Job Run abgeschlossen ist. Lesen Sie weiter unten, warum dieses neue Muster ein sofortiger Klassiker ist.

Die gemeinsame Nutzung von Azure Data Factory und Azure Databricks ist seit 2018 ein GA-Muster, als es mit diesem Blogbeitrag veröffentlicht wurde. Seitdem ist die Integration ein fester Bestandteil für Azure-Kunden, die hauptsächlich diesem einfachen Muster gefolgt sind:
Obwohl dieses Muster im Laufe der Zeit äußerst wertvoll war, hat es die Kunden auf die folgenden Betriebsmodi beschränkt, die ihnen den vollen Wert von Databricks vorenthalten:
Obwohl dieses Muster skalierbar und nativ für Azure Data Factory und Azure Databricks ist, sind die angebotenen Tools und Funktionen seit ihrer Einführung im Jahr 2018 unverändert geblieben, obwohl sich Databricks zu der marktführenden Data Intelligence Platform über alle Clouds hinweg entwickelt hat.
Azure Databricks geht über traditionelle Analysen hinaus, um eine einheitliche Data Intelligence Platform auf Azure bereitzustellen. Es kombiniert branchenführende Lakehouse-Architektur mit integrierter KI und fortschrittlicher Governance, um Kunden zu helfen, Erkenntnisse schneller, kostengünstiger und mit unternehmensweiter Sicherheit zu gewinnen. Zu den wichtigsten Funktionen gehören:
Mit der Veröffentlichung der nativen Databricks Job-Aktivität in Azure Data Factory können Kunden jetzt Databricks Workflows ausführen und Parameter an die Job Runs übergeben. Dieses neue Muster löst nicht nur die oben genannten Einschränkungen, sondern ermöglicht auch die Nutzung der folgenden Funktionen in Databricks, die zuvor nicht in ADF verfügbar waren, wie zum Beispiel:
Am wichtigsten ist, dass Kunden jetzt die ADF Databricks Job-Aktivität nutzen können, um die Publish to Power BI Tasks in Databricks Workflows zu nutzen, die semantische Modelle automatisch aus Schemas in Unity Catalog im Power BI Service veröffentlicht und einen Import auslöst, wenn Tabellen mit Speicher-Modi vorhanden sind, die Import oder Dual verwenden (Einrichtungsanweisungen finden Sie in der Dokumentation). Eine Demo zu Power BI Tasks in Databricks Workflows finden Sie hier. Ergänzend dazu finden Sie das Power BI on Databricks Best Practices Cheat Sheet – ein prägnanter, umsetzbarer Leitfaden, der Teams hilft, ihre Berichte von Anfang an für Leistung, Kosten und Benutzererfahrung zu konfigurieren und zu optimieren.


Die Databricks Job-Aktivität in ADF ist die neue Best Practice
Die Verwendung der Databricks Job-Aktivität in Azure Data Factory zum Starten von Databricks Workflows ist die neue Best Practice-Integration bei der Verwendung der beiden Tools. Kunden können dieses Muster sofort nutzen, um alle Funktionen der Databricks Data Intelligence Platform zu nutzen. Für Kunden, die ADF verwenden, führt die Verwendung der ADF Databricks Job-Aktivität zu sofortigem Geschäftswert und Kosteneinsparungen. Kunden mit ETL-Frameworks, die Notebook-Aktivitäten verwenden, sollten ihre Frameworks auf Databricks Workflows und die neue ADF Databricks Job-Aktivität migrieren und diese Initiative in ihrer Roadmap priorisieren.
Jetzt kostenlos testen mit einem 14-tägigen kostenlosen Testversion von Azure Databricks.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
