Aujourd'hui, nous introduisons la préversion publique des Databricks Asset Bundles dans l'espace de travail. Cela permettra aux data scientists, analystes et ingénieurs de données ou d'IA de travailler plus facilement de manière interactive dans l'espace de travail avec des bonnes pratiques telles que le contrôle de version, les tests et l'intégration continue/déploiement continu (CI/CD). Les membres de l'équipe peuvent collaborer directement en utilisant des dossiers Git dans l'interface utilisateur de l'espace de travail et n'ont pas besoin d'utiliser une CLI.
La gestion de la structure, du contrôle de version et du déploiement sécurisé sont essentiels pour tout flux de travail d'ingénierie de données fiable. Les Databricks Asset Bundles facilitent cela en vous permettant de définir des jobs, des pipelines, des notebooks et des configurations sous forme de code, déployables sur différents environnements et prêts pour l'intégration CI/CD.
Des milliers d'équipes d'ingénierie de données utilisent déjà des bundles pour mettre en production leurs flux de travail, appliquer les bonnes pratiques et collaborer via Git. Mais une demande constante est ressortie :
"Puis-je l'utiliser directement dans l'espace de travail, sans avoir besoin de la CLI ou de VS Code ?"
Aujourd'hui, nous répondons à cette demande.
Cette mise à jour étend les outils que de nombreuses équipes connaissent déjà : l'espace de travail, les dossiers Git et les asset bundles. Désormais, vous pouvez développer et déployer des bundles entièrement au sein de Databricks : ouvrez simplement un dossier Git, définissez votre bundle et déployez-le en un clic. L'étape claire de Déploiement garantit que la promotion des changements du développement à la production est intentionnelle, qu'elle soit déclenchée par un utilisateur de l'espace de travail ou via CI/CD.
Au total, vous pouvez :
Cela rationalise le processus de développement dans les dossiers Git. Cela apporte une structure à la progression du travail du développement à la production, s'alignant sur les pratiques logicielles standard et rendant le processus accessible à un plus large éventail d'utilisateurs.
Lorsque vous travaillez dans un dossier Git, les utilisateurs peuvent itérer rapidement sur les changements non validés. Les jobs de développement, les pipelines et autres ressources définis dans le bundle référencent automatiquement les derniers fichiers, sans synchronisation manuelle nécessaire. Ce comportement est alimenté par source_linked_deployment, qui est activé par défaut en mode développement, permettant une itération et un feedback plus rapides.
Nous continuons d'améliorer l'expérience. Les futures mises à jour permettront de :
Que vous construisiez des pipelines de données, entraîniez des modèles ou créiez des tableaux de bord, les asset bundles dans les dossiers Git offrent un chemin collaboratif et structuré pour passer de l'idée à la production, le tout depuis l'espace de travail Databricks.
Alternativement, vous pouvez cloner un dépôt existant avec des bundles ou des exemples existants tels que https://github.com/databricks/bundle-examples.
Remarque : Assurez-vous que la préversion est activée pour utilisation (voir ci-dessous)
En savoir plus : documentation.
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
