Passa al contenuto principale

Che cos'è Jupyter Notebook?

Applicazione web open source per documenti interattivi che combina codice live, equazioni, visualizzazioni e testo narrativo in Python, R e Julia

4 Personas Agnostic 5

Summary

  • L'architettura include un kernel (motore di calcolo) che esegue codice in un linguaggio di programmazione specifico, un server che gestisce le istanze del kernel e fornisce l'interfaccia notebook, nonché un'interfaccia utente basata sul web che consente un editing avanzato con markdown, LaTeX e incorporamento di contenuti multimediali.
  • Supporta l'esplorazione interattiva dei dati, la ricerca riproducibile, l'analisi collaborativa, la creazione di tutorial e report pronti per la presentazione con visualizzazioni in linea utilizzando librerie come matplotlib, seaborn, plotly e widget interattivi.
  • Le integrazioni includono il controllo delle versioni Git, l'archiviazione cloud (S3, Azure Blob), framework per big data (Spark, Dask) e JupyterHub per distribuzioni multiutente con gestione delle risorse e autenticazione.

Che cos'è un notebook Jupyter?

Logo Jupyter

Un notebook Jupyter è un'applicazione web open-source che consente ai data scientist di creare e condividere documenti che contengono codice live, equazioni e altre risorse multimediali.

A che cosa servono i notebook Jupyter?

I notebook Jupyter vengono utilizzati per ogni tipo di attività di data science, come analisi esplorativa (EDA), pulizia e trasformazione dei dati, visualizzazione dei dati, modellazione statistica, machine learning e deep learning.

Quali vantaggi offre l'utilizzo dei notebook Jupyter?

I notebook Jupyter sono utili in particolare per "mostrare il lavoro" fatto dal team di gestione dei dati attraverso una combinazione di codice, annotazioni, link e immagini. Sono facili da usare e possono essere eseguiti cella per cella per capire meglio che cosa fa il codice.

I notebook Jupyter possono anche essere convertiti in diversi formati standard di uscita (HTML, Powerpoint, LaTeX, PDF, ReStructuredText, Markdown, Python) attraverso l'interfaccia web. Questa flessibilità agevola i data scientist che devono condividere il loro lavoro con altri.

Come funzionano i notebook Jupyter?

Un notebook Jupyter ha due componenti: una pagina web front-end e un kernel back-end. La pagina web front-end consente ai data scientist di inserire codice di programmazione o testo in "celle" rettangolari. Il browser passa quindi il codice al kernel back-end che lo esegue e restituisce i risultati.

LEADER PER LA 5ª VOLTA

Gartner®: Databricks leader dei database cloud

Quali sono le controindicazioni dell'utilizzo di notebook Jupyter?

  • Difficoltà di manutenzione e sincronizzazione quando più persone lavorano sullo stesso codice.
  • Difficoltà di operazionalizzare il codice perché i notebook Jupyter non hanno alcuna integrazione o strumenti integrati per operazionalizzare i modelli di machine learning.
  • Difficile scalabilità — I notebook Jupyter sono progettati per data science con un singolo nodo. Se il volume di dati eccede la capacità di memoria del computer, utilizzare i notebook Jupyter diventa molto più difficile.

Sono disponibili notebook Jupyter su Databricks?

Stai cercando uno strumento evoluto per attività collaborative di data science? La risposta è Databricks! I nostri notebook consentono di collaborare con colleghi dei team di ingegneria, data science e machine learning in diversi linguaggi, con visualizzazioni integrate dei dati e operazionalizzazione con lavori. Registrati per una prova gratuita.

Databricks supporta i notebook Jupyter?

Sì. I cluster di Databricks possono essere configurati per utilizzare il kernel IPython allo scopo di sfruttare i vantaggi degli strumenti open-source dell'ecosistema Jupyter (strumenti di visualizzazione e di output, ad esempio). Databricks offre inoltre il supporto per l'importazione e l'esportazione di file .ipynb, pertanto è possibile proseguire su Databricks il lavoro esattamente dal punto in cui è stato interrotto nel notebook Jupyter, e viceversa. Infine, Databricks supporta da tempo le librerie open-source di Jupyter all'interno di Databricks Machine Learning Runtime.

Come usare il kernel IPython su Databricks

È facile. Leggi la documentazione, poi registrati per una prova gratuita di Databricks.

 

Risorse aggiuntive

Non perdere mai un post di Databricks

Iscriviti al nostro blog e ricevi gli ultimi post direttamente nella tua casella di posta elettronica.