Revenir au contenu principal

Qu'est-ce que Sparkr ?

Exécutez des programmes R à grande échelle grâce au moteur de calcul distribué Apache Spark, avec une syntaxe R familière.

4 Personas Analytics AIBI 4

Summary

  • SparkR met la puissance du calcul distribué d'Apache Spark à la disposition des programmeurs R grâce à une syntaxe R familière.
  • La plupart des fonctionnalités de Python Spark sont disponibles dans SparkR, ce qui simplifie le traitement des données massives pour les utilisateurs de R.
  • L'outil s'intègre parfaitement aux environnements R, permettant aux data scientists d'adapter leurs flux de travail R existants.

SparkR est un outil qui permet d'exécuter R sur Spark. Il se conforme aux mêmes principes que toutes les autres liaisons de langage de Spark. Pour utiliser SparkR, il suffit de l'importer dans votre environnement et d'exécuter votre code. Il ressemble beaucoup à l'API Python, sauf qu'il suit la syntaxe de R plutôt que celle de Python. Pour l'essentiel, ce qui est disponible dans Python est disponible aussi dans SparkR.
 

Ressources complémentaires

UN LEADER 5X

Gartner® : Databricks, leader des bases de données cloud

Ne manquez jamais un article Databricks

Abonnez-vous à notre blog et recevez les derniers articles dans votre boîte mail.