Apache Spark™
Apache Spark es un motor de análisis unificado ultrarrápido para big data y aprendizaje automático. Fue desarrollado originalmente en UC Berkeley en 2009.

El proyecto de código abierto más grande en procesamiento de datos.
Desde su lanzamiento, Apache Spark, el motor de analítica unificado, fue adoptado rápidamente por empresas de una amplia gama de industrias. Las potencias de Internet como Netflix, Yahoo y eBay desplegaron Spark a gran escala, procesando en conjunto múltiples petabytes de datos en clústeres de más de 8000 nodos. Se convirtió rápidamente en la comunidad de código abierto más grande en big data, con más de 1000 colaboradores de más de 250 organizaciones.

El equipo que inició el proyecto de investigación Spark en UC Berkeley fundó Databricks en 2013.
Apache Spark es 100 % de código abierto, y está alojado en la Apache Software Foundation, independiente de cualquier proveedor. En Databricks, estamos totalmente comprometidos con mantener este modelo de desarrollo abierto. Junto con la comunidad de Spark, Databricks sigue contribuyendo significativamente al proyecto Apache Spark, tanto a través del desarrollo como de la evangelización comunitaria.
Qué es Apache Spark - Beneficios de Apache Spark
Prueba Apache Spark en la nube de Databricks de forma gratuita
Databricks Unified Analytics Platform ofrece un rendimiento 5 veces mayor que Spark de código abierto, documentos interactivos colaborativos, flujos de trabajo integrados y seguridad empresarial, todo en una plataforma en la nube totalmente gestionada.
El proyecto de código abierto Apache Spark puede descargarse aquí.