Demo dei Pacchetti di Risorse Databricks

Che cosa imparerai

I pacchetti di risorse Databricks rendono possibile esprimere progetti completi di dati, analisi e ML come una raccolta di file sorgente chiamata bundle. I file sorgente di un pacchetto fungono da definizione end-to-end di un progetto. Questi file sorgente includono informazioni su come devono essere testati e distribuiti. Questa definizione end-to-end rende semplice applicare le migliori pratiche di ingegneria dei dati come il controllo del codice sorgente, la revisione del codice, i test e il CI/CD.

Un pacchetto include le seguenti parti:

  • I file sorgente, come i notebook e i file Python, includono la logica aziendale.

  • Dichiarazioni e impostazioni per le risorse Databricks, come i lavori Databricks, i pipeline Delta Live Tables, i punti di terminazione del servizio di modelli, gli esperimenti MLflow e i modelli registrati MLflow.

  • Test unitari e test di integrazione.

  • Configurazioni che definiscono in quale o quali spazi di lavoro il pacchetto deve essere distribuito.