Ir al contenido principal

¿Qué es Jupyter Notebook?

Aplicación web de código abierto para documentos interactivos que combina código en vivo, ecuaciones, visualizaciones y texto narrativo en Python, R y Julia

4 Personas Agnostic 5

Summary

  • La arquitectura incluye un kernel (motor de cálculo) que ejecuta código en un lenguaje de programación específico, un servidor que administra las instancias del kernel y sirve como interfaz para notebooks, y una interfaz de usuario web que permite una edición enriquecida con Markdown, LaTeX e incrustación de medios.
  • Admite la exploración interactiva de datos, la investigación reproducible, el análisis colaborativo, la creación de tutoriales y la creación de informes listos para presentaciones con visualizaciones en línea mediante bibliotecas como matplotlib, seaborn, plotly y widgets interactivos.
  • Las integraciones incluyen control de versiones de Git, almacenamiento en la nube (S3, Azure Blob), frameworks de big data (Spark, Dask) y JupyterHub para implementaciones multiusuario con gestión de recursos y autenticación.

¿Qué es un Jupyter Notebook?

Logotipo de Jupyter

Un Jupyter Notebook es una aplicación web de código abierto que permite a los científicos de datos crear y compartir documentos que incluyen código en vivo, ecuaciones y otros recursos multimedia.

¿Para qué se utilizan los Jupyter Notebooks?

Los cuadernos Jupyter se utilizan para todo tipo de tareas de ciencia de datos como análisis exploratorio de datos (EDA), limpieza y transformación de datos, visualización de datos, modelado estadístico, aprendizaje automático y aprendizaje profundo.

¿Cuáles son los beneficios de usar Jupyter Notebooks?

Los cuadernos Jupyter son especialmente útiles para "mostrar el trabajo" que realizó tu equipo de datos mediante una combinación de código, markdown, enlaces e imágenes. Son fáciles de usar y se pueden ejecutar celda por celda para comprender mejor lo que hace el código.

Los cuadernos Jupyter también se pueden convertir a varios formatos de salida estándar (HTML, PowerPoint, LaTeX, PDF, ReStructuredText, Markdown, Python) mediante la interfaz web. Esta flexibilidad facilita que los científicos de datos compartan su trabajo con otros.

¿Cómo funcionan los Jupyter Notebooks?

Un cuaderno de Jupyter tiene dos componentes: una página web de front-end y un kernel de back-end. La página web frontal permite a los científicos de datos introducir código de programación o texto en celdas rectangulares llamadas "celdas". Luego, el navegador pasa el código al núcleo del back-end, que lo ejecuta y devuelve los resultados.

LÍDER 5X

Gartner®: Databricks, líder en bases de datos en la nube

¿Cuáles son las desventajas de usar Jupyter Notebooks?

  • Es difícil de mantener y sincronizar cuando se trabaja en equipo en el código.
  • Es difícil operacionalizar tu código al usar cuadernos Jupyter, ya que no cuentan con ninguna integración o herramientas integradas para operacionalizar tus modelos de aprendizaje automático.
  • Es difícil de escalar: los cuadernos Jupyter están diseñados para ciencia de datos de un único nodo. Si tus datos son demasiado grandes para caber en la memoria de tu computadora, usar cuadernos Jupyter se vuelve mucho más difícil.

¿Están disponibles los cuadernos Jupyter en Databricks?

¿Buscas una herramienta poderosa de colaboración en ciencia de datos? ¡No busques más: Databricks! Nuestros cuadernos te permiten trabajar junto con colegas de los equipos de ingeniería, ciencia de datos y aprendizaje automático en varios idiomas, con visualizaciones de datos integradas y operacionalización con trabajos. Regístrate para obtener una prueba gratuita.

¿Databricks ofrece soporte para Jupyter Notebooks?

Sí. Los clústeres de Databricks se pueden configurar para usar el kernel IPython con el fin de aprovechar las herramientas de código abierto del ecosistema de Jupyter (por ejemplo, las herramientas de visualización y de salida). Databricks también ofrece soporte para importar y exportar archivos .ipynb, para que puedas retomar fácilmente justo donde lo dejaste en tu cuaderno Jupyter, en Databricks, y viceversa. Finalmente, Databricks ha apoyado durante mucho tiempo las bibliotecas principales de código abierto de Jupyter dentro del Databricks Machine Learning Runtime.

Cómo utilizar el kernel IPython en Databricks

Es fácil. Consulta la documentación y regístrate para obtener una prueba gratuita de Databricks.

 

Recursos adicionales

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.