Veröffentlicht: 13. Juni 2025
von Fabian Jakobs, Lennart Kats und Saad Ansari
Heute stellen wir die Public Preview von Databricks Asset Bundles im Workspace vor. Dies erleichtert Data Scientists, Analysten sowie Data- und AI-Engineers die interaktive Arbeit im Workspace mit Best Practices wie Versionskontrolle, Tests und CI/CD. Teammitglieder können direkt über Git-Ordner in der Workspace-Benutzeroberfläche zusammenarbeiten und benötigen keine CLI.
Die Verwaltung von Struktur, Versionskontrolle und sicheren Deployments sind entscheidend für jeden zuverlässigen Data-Engineering-Workflow. Databricks Asset Bundles vereinfachen dies, indem sie es Ihnen ermöglichen, Jobs, Pipelines, Notebooks und Konfigurationen als Code zu definieren – bereit für die Bereitstellung in verschiedenen Umgebungen und für die CI/CD-Integration.
Tausende von Data-Engineering-Teams nutzen bereits Bundles, um ihre Workflows zu produktivieren, Best Practices anzuwenden und über Git zusammenzuarbeiten. Aber eine wiederkehrende Anfrage stach hervor:
„Kann ich das direkt im Workspace nutzen, ohne die CLI oder VS Code zu benötigen?“
Heute erfüllen wir diese Anforderung.
Dieses Update erweitert Tools, die viele Teams bereits kennen: den Workspace, Git-Ordner und Asset Bundles. Jetzt können Sie Bundles vollständig innerhalb von Databricks entwickeln und bereitstellen: Öffnen Sie einfach einen Git-Ordner, definieren Sie Ihr Bundle und stellen Sie es mit einem Klick bereit. Der klare Deploy-Schritt stellt sicher, dass die Übernahme von Änderungen von der Entwicklung zur Produktion bewusst erfolgt, egal ob durch einen Workspace-Benutzer oder über CI/CD ausgelöst.
Insgesamt können Sie:
Dies optimiert den Entwicklungsprozess innerhalb von Git-Ordnern. Es bringt Struktur in den Arbeitsablauf von der Entwicklung bis zur Produktion, richtet sich nach gängigen Softwarepraktiken und macht den Prozess für eine breitere Benutzergruppe zugänglich.
Beim Arbeiten in einem Git-Ordner können Benutzer schnell an unbestätigten Änderungen iterieren. Entwicklungsjobs, Pipelines und andere im Bundle definierten Ressourcen verweisen automatisch auf die neuesten Dateien – kein manuelles Synchronisieren erforderlich. Dieses Verhalten wird durch source_linked_deployment ermöglicht, das im Entwicklungsmodus standardmäßig aktiviert ist und schnellere Iteration und Feedback ermöglicht.
Wir arbeiten kontinuierlich an der Verbesserung des Erlebnisses. Zukünftige Updates werden:
Ob Sie Datenpipelines erstellen, Modelle trainieren oder Dashboards entwickeln, Asset Bundles in Git-Ordnern bieten einen kollaborativen und strukturierten Weg, um von der Idee zur Produktion zu gelangen – alles innerhalb des Databricks-Workspaces.
Alternativ können Sie ein bestehendes Repo mit vorhandenen Bundles oder Beispielen wie https://github.com/databricks/bundle-examples klonen.
Hinweis: Stellen Sie sicher, dass die Vorschau zur Nutzung aktiviert ist (siehe unten)
Mehr erfahren: Dokumentation.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
