Oggi presentiamo l'anteprima pubblica di Databricks Asset Bundles nell'area di lavoro. Questo renderà più facile per data scientist, analisti e ingegneri di dati o AI lavorare in modo interattivo nell'area di lavoro con best practice come il controllo di versione, il testing e la CI/CD. I membri del team possono collaborare direttamente utilizzando le cartelle Git nell'interfaccia utente dell'area di lavoro e non è necessario utilizzare una CLI.
La gestione della struttura, il controllo di versione e il deployment sicuro sono fondamentali per qualsiasi flusso di lavoro di data engineering affidabile. Databricks Asset Bundles semplifica questo processo consentendo di definire job, pipeline, notebook e configurazioni come codice, distribuibili tra ambienti e pronti per l'integrazione CI/CD.
Migliaia di team di data engineering utilizzano già i bundle per mettere in produzione i loro flussi di lavoro, applicare best practice e collaborare tramite Git. Ma una richiesta costante è emersa:
"Posso usarlo direttamente nell'area di lavoro, senza bisogno della CLI o di VS Code?"
Oggi, stiamo soddisfacendo questa richiesta.
Questo aggiornamento estende gli strumenti che molti team già conoscono: l'area di lavoro, le cartelle Git e i bundle di asset. Ora, puoi sviluppare e distribuire bundle interamente all'interno di Databricks: apri una cartella Git, definisci il tuo bundle e distribuiscilo con un clic. Il chiaro passaggio Deploy garantisce che la promozione delle modifiche da sviluppo a produzione sia intenzionale, sia che venga attivata da un utente dell'area di lavoro o tramite CI/CD.
In totale, puoi:
Questo semplifica il processo di sviluppo all'interno delle cartelle Git. Porta struttura al modo in cui il lavoro progredisce dallo sviluppo alla produzione, allineandosi alle pratiche software standard e rendendo il processo accessibile a una gamma più ampia di utenti.
Quando si lavora in una cartella Git, gli utenti possono iterare rapidamente sulle modifiche non committate. I job di sviluppo, le pipeline e altre risorse definite nel bundle fanno automaticamente riferimento ai file più recenti, senza necessità di sincronizzazione manuale. Questo comportamento è alimentato da source_linked_deployment, che è abilitato per impostazione predefinita in modalità di sviluppo, consentendo un'iterazione e un feedback più rapidi.
Continuiamo a migliorare l'esperienza. Aggiornamenti futuri:
Che tu stia creando pipeline di dati, addestrando modelli o creando dashboard, i bundle di asset nelle cartelle Git offrono un percorso collaborativo e strutturato per passare dall'idea alla produzione, tutto dall'interno dell'area di lavoro Databricks.
In alternativa, puoi clonare un repository esistente con bundle o esempi esistenti come https://github.com/databricks/bundle-examples.
Nota: assicurati che l'anteprima sia abilitata per l'uso (vedi sotto)
Ulteriori informazioni: documentazione.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
