Ir al contenido principal

¿Qué es Apache Spark como servicio?

Apache Spark optimizado en la nube como clústeres llave en mano para procesamiento por lotes, SQL, transmisión, ML y computación de gráficos sin administración de infraestructura

4 Personas Analytics AIBI 2a

Summary

  • Aprovecha las capacidades de Spark para la transmisión de datos, el cálculo de grafos, SQL en Hadoop y el aprendizaje automático con aplicaciones integradas que aceleran el acceso y el análisis de datos en el procesamiento distribuido a gran escala.
  • Elimina los desafíos de infraestructura y acelera la implementación al eliminar los costos de hardware y las barreras de adopción a gran escala, ideal para proyectos de análisis a corto plazo con alto retorno de la inversión (ROI) y necesidades temporales de exploración de datos.
  • Proporciona fácil acceso a datos de Hive, HDFS, HBase y Amazon S3 sin necesidad de conocimientos de programación especializados, lo que permite a los usuarios técnicos y comerciales aprovechar el análisis de big data antes de comprometerse con inversiones completas en el sistema.

¿Qué es Apache Spark como servicio?

Apache Spark es un marco de computación en clúster de código abierto para el procesamiento rápido de datos a gran escala en tiempo real. Desde su creación en 2009 en el AMPLab de la Universidad de California en Berkeley, Spark ha logrado un gran crecimiento. Actualmente está considerada como la mayor comunidad de código abierto en el ámbito de big data y cuenta con más de 200 colaboradores de más de 50 organizaciones. Databricks aloja su versión optimizada de Apache Spark como Spark-as-a-Service en varias nubes. Viene con un conjunto de aplicaciones integradas que pueden ayudarte a acceder y analizar datos más rápidamente. Aprovecha todas las capacidades de Spark para operar con big data, como su capacidad para trabajar con datos de transmisión, realizar cálculos gráficos, ofrecer SQL en Hadoop y su funcionalidad de aprendizaje automático. Aunque la mayoría de las organizaciones han reconocido las oportunidades que ofrece Spark, muchas siguen teniendo dificultades. ¿Por qué? Debido a los retos a los que se enfrentan las organizaciones al intentar analizar flujos de datos o grandes cantidades de datos.  Sin embargo, esto no significa que no pueda aprovechar las ventajas que ofrece Spark sin necesidad de realizar inversiones en hardware ni de adoptarlo e implementarlo a gran escala. Spark como servicio elimina los retos de infraestructura y acelera el proceso al eliminar la mayor parte de los costos y el esfuerzo necesarios. Ya hay varios proveedores que ofrecen Spark como servicio, lo que facilita y agiliza la implementación de este marco. Esta solución funciona muy bien para proyectos de análisis de datos a corto plazo que se pueden configurar con rapidez y ofrecen un alto retorno de inversión. Spark como servicio facilita el procesamiento y la consulta de datos almacenados en Hive, HDFS, HBase y Amazon S3. Spark como servicio es probablemente la mejor opción si tienes un proyecto de análisis temporal. También demostró ser la opción preferida para las empresas que deseaban conocer las ventajas de utilizar big data y análisis de datos antes de realizar grandes inversiones en su propio sistema de procesamiento de big data.

LÍDER 5X

Gartner®: Databricks, líder en bases de datos en la nube

Principales ventajas de usar Spark como servicio:

Ventajas de usar Spark como servicio

  • Una manera fácil de acceder a los datos de Spark.
  • No se requieren conocimientos especializados de programación, por lo que resulta fácil de usar tanto para usuarios técnicos como para usuarios empresariales.
  • Costos más bajos.

Apache Spark como servicio: introducción sencilla a Spark

Recursos adicionales

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.

¿Qué sigue?

4 Personas Analytics AIBI 3a

Fundamentos de Data + AI

17 min de lectura

O que é Narrativa de Dados?

4 Personas Analytics AIBI 2a

Fundamentos de Data + AI

16 min de lectura

O que é Extrair, Carregar e Transformar (ELT)?