Un componente chiave di Databricks è Data Science Workspace, che consente la collaborazione fra tutti i membri del team di gestione dei dati. L'ambiente collaborativo del notebook viene utilizzato da tutti i componenti del team: data scientist, analisti, ingegneri e altri. Databricks viene impiegato in svariati settori industriali per una gamma di casi d'uso altrettanto ampia. Questa galleria mostra alcune possibilità offerte dai Notebook, che possono essere facilmente importati nell'ambiente di Databricks o nell'edizione gratuita per community (CE).
Delta Lake
Costruisci il tuo data lakehouse e crea transazioni ACID, time travel, vincoli e altro ancora in formati di file aperti
Databricks: 7.6.x – no CE
Approfondimento su Delta Lake
Delta Lake è un formato di storage open-source che porta le transazioni ACID in Apache Spark™.
Databricks: 8.0.x
Utilizzare Delta Lake da R
Introduzione rapida all'utilizzo di Delta Lake, un formato di storage open-source, con SparkR.
Machine Learning
Supporto per framework di machine learning diffusi come TensorFlow, Spark MLlib, Horovod
Databricks: 7.6.x con GPU – no CE
Deep learning distribuito con PyTorch e Horovod
Come eseguire l'addestramento distribuito di modelli in PyTorch usando Horovod.
Databricks: 8.1.x
Costruire un'applicazione ML in streaming con Spark
Costruire un'applicazione ML in streaming che monitora le frodi sulle carte di credito utilizzando Spark.
Databricks: 7.6.x
Primi passi con Spark MLlib
Introduzione all'uso della libreria Spark MLlib per applicazioni ML.
Databricks: 7.6.x con GPU – no CE
Da Spark a TensorFlow: Semplificare la conversione dei dati
Semplifica la conversione di dati da Spark DataFrames per l'utilizzo con TensorFlow.
MLflow
Supporto completo per machine learning: dall'addestramento dei modelli al loro passaggio in produzione
Databricks: 7.6.x
Primi passi con la registrazione per progetti ML con MLflow
Introduzione all'API di registrazione MLflow per gestire il flusso di lavoro ML.
Databricks: 7.6.x
Introduzione rapida: come usare le API di tracciamento Fluent di MLflow
Come usare le API Fluent di tracciamento di alto livello in MLflow.
Databricks: 7.6.x – no CE
Esempio completo di machine learning per dati tabellari
Questo notebook offre un esempio di ciclo di vita ML completo per dati tabellari.
Apache Spark™
Motore di calcolo distribuito che supporta data engineering e data science per il data lakehouse
Databricks: 8.1.x
Applicazioni in streaming per dati di sensori
Come usare lo streaming strutturato in Spark per applicazioni con dati di sensori.
Databricks: 8.1.x
Analisi delle chiamate ai vigili del fuoco di San Francisco con Spark
Spark ETL per analizzare le chiamate ai vigili del fuoco di San Francisco.
Databricks: 8.1.x
Interagire con sorgenti di dati esterne da Spark
Breve introduzione all'accesso e all'interazione con sorgenti di dati esterne da Spark.
Databricks: 8.1.x
Streaming strutturato per applicazioni in tempo reale
Introduzione alla semantica dello streaming strutturato in Spark per dati in tempo reale.
Databricks: 8.0.x – non CE
Estendere SparkR con funzioni definite dall'utente (UDF)
Come estendere le funzionalità di SparkR attraverso funzioni personalizzate scritte con UDF in R.
Casi d'uso
Databricks viene utilizzato in molti settori, fra cui finanza, retail, tecnologia, manifatturiero e altri
Databricks: 7.6.x
Analisi del paniere di mercato per il retail
Questo notebook mostra come eseguire l'analisi del paniere di mercato nel settore retail.
Acceleratori
Template completi per l'utilizzo di Databricks in cinque settori industriali

