Ir al contenido principal

Jupyter Notebook

Prueba Databricks gratis

¿Qué es un Jupyter Notebook?

Logotipo de Jupyter

Un Jupyter Notebook es una aplicación web de código abierto que permite a los científicos de datos crear y compartir documentos que incluyen código en vivo, ecuaciones y otros recursos multimedia.

¿Para qué se utilizan los Jupyter Notebooks?

Los cuadernos Jupyter se utilizan para todo tipo de tareas de ciencia de datos como análisis exploratorio de datos (EDA), limpieza y transformación de datos, visualización de datos, modelado estadístico, aprendizaje automático y aprendizaje profundo.

¿Cuáles son los beneficios de usar Jupyter Notebooks?

Los cuadernos Jupyter son especialmente útiles para "mostrar el trabajo" que realizó tu equipo de datos mediante una combinación de código, markdown, enlaces e imágenes. Son fáciles de usar y se pueden ejecutar celda por celda para comprender mejor lo que hace el código.

Los cuadernos Jupyter también se pueden convertir a varios formatos de salida estándar (HTML, PowerPoint, LaTeX, PDF, ReStructuredText, Markdown, Python) mediante la interfaz web. Esta flexibilidad facilita que los científicos de datos compartan su trabajo con otros.

¿Cómo funcionan los Jupyter Notebooks?

Un cuaderno de Jupyter tiene dos componentes: una página web de front-end y un kernel de back-end. La página web frontal permite a los científicos de datos introducir código de programación o texto en celdas rectangulares llamadas "celdas". Luego, el navegador pasa el código al núcleo del back-end, que lo ejecuta y devuelve los resultados.

¿Cuáles son las desventajas de usar Jupyter Notebooks?

  • Es difícil de mantener y sincronizar cuando se trabaja en equipo en el código.
  • Es difícil operacionalizar tu código al usar cuadernos Jupyter, ya que no cuentan con ninguna integración o herramientas integradas para operacionalizar tus modelos de aprendizaje automático.
  • Es difícil de escalar: los cuadernos Jupyter están diseñados para ciencia de datos de un único nodo. Si tus datos son demasiado grandes para caber en la memoria de tu computadora, usar cuadernos Jupyter se vuelve mucho más difícil.

¿Están disponibles los cuadernos Jupyter en Databricks?

¿Buscas una herramienta poderosa de colaboración en ciencia de datos? ¡No busques más: Databricks! Nuestros cuadernos te permiten trabajar junto con colegas de los equipos de ingeniería, ciencia de datos y aprendizaje automático en varios idiomas, con visualizaciones de datos integradas y operacionalización con trabajos. Regístrate para obtener una prueba gratuita.

¿Databricks ofrece soporte para Jupyter Notebooks?

Sí. Los clústeres de Databricks se pueden configurar para usar el kernel IPython con el fin de aprovechar las herramientas de código abierto del ecosistema de Jupyter (por ejemplo, las herramientas de visualización y de salida). Databricks también ofrece soporte para importar y exportar archivos .ipynb, para que puedas retomar fácilmente justo donde lo dejaste en tu cuaderno Jupyter, en Databricks, y viceversa. Finalmente, Databricks ha apoyado durante mucho tiempo las bibliotecas principales de código abierto de Jupyter dentro del Databricks Machine Learning Runtime.

Cómo utilizar el kernel IPython en Databricks

Es fácil. Consulta la documentación y regístrate para obtener una prueba gratuita de Databricks.

 

Recursos adicionales

Volver al glosario