Ir al contenido principal

¿Qué es Sparkr?

Ejecute programas R a escala utilizando el motor de computación distribuida de Apache Spark con la sintaxis R familiar

4 Personas Analytics AIBI 4

Summary

  • SparkR lleva la potencia de la computación distribuida de Apache Spark a los programadores de R mediante una sintaxis familiar.
  • La mayoría de las funciones de Python Spark están disponibles en SparkR, lo que facilita a los usuarios de R trabajar con big data.
  • La herramienta se integra perfectamente en entornos R, lo que permite a los científicos de datos escalar sus flujos de trabajo existentes.

SparkR es una herramienta para ejecutar R en Spark. Sigue los mismos principios que todos los demás enlaces de lenguaje de Spark. Para usar SparkR, simplemente lo importamos a nuestro entorno y ejecutamos nuestro código. Todo es muy similar a la API de Python, excepto que sigue la sintaxis de R en lugar de la de Python. En su mayor parte, casi todo lo disponible en Python está disponible en SparkR.
 

Recursos adicionales

LÍDER 5X

Gartner®: Databricks, líder en bases de datos en la nube

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.