Le projet Tungsten optimise le moteur d'exécution de Spark grâce à une utilisation plus intelligente de la mémoire, des algorithmes prenant en compte le cache et la génération de code, pour des performances proches de celles d'un système nu.
Tungsten est le nom de code d’un projet global visant à modifier le moteur d’exécution d’Apache Spark. Il a pour but d'améliorer considérablement l’efficacité de sa mémoire et de son unité centrale pour les applications Spark, en se rapprochant des performances des matériels les plus modernes.
L’accent mis sur l’efficacité du processeur est dû au fait que les workloads Spark sont de plus en plus bloqués par l’utilisation du processeur et de la mémoire, plutôt que par les E/S (entrées/sorties) et la communication réseau. Cette tendance est illustrée par les recherches récentes sur les performances des workloads de Big Data.
Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.