Summary
- SparkR met la puissance du calcul distribué d'Apache Spark à la disposition des programmeurs R grâce à une syntaxe R familière.
- La plupart des fonctionnalités de Python Spark sont disponibles dans SparkR, ce qui simplifie le traitement des données massives pour les utilisateurs de R.
- L'outil s'intègre parfaitement aux environnements R, permettant aux data scientists d'adapter leurs flux de travail R existants.
SparkR est un outil qui permet d'exécuter R sur Spark. Il se conforme aux mêmes principes que toutes les autres liaisons de langage de Spark. Pour utiliser SparkR, il suffit de l'importer dans votre environnement et d'exécuter votre code. Il ressemble beaucoup à l'API Python, sauf qu'il suit la syntaxe de R plutôt que celle de Python. Pour l'essentiel, ce qui est disponible dans Python est disponible aussi dans SparkR.
Ressources complémentaires
Rapport

