Depuis des années, Apache Spark Structured Streaming alimente certaines des charges de travail de streaming les plus exigeantes au monde. Cependant, pour les cas d'utilisation à latence ultra-faible, les équipes devaient maintenir des moteurs spécialisés distincts — le plus souvent Apache Flink, en plus de Spark, dupliquant les bases de code, les modèles de gouvernance et la surcharge opérationnelle. Désormais, Databricks supprime ce fardeau pour ses clients.
Aujourd'hui, nous sommes ravis d'annoncer la disponibilité générale du mode temps réel (RTM) dans Spark Structured Streaming, apportant une latence de l'ordre de la milliseconde aux API Spark que vous utilisez déjà. Qu'il s'agisse de détecter la fraude en temps réel ou de générer un contexte récent et en temps réel pour piloter vos agents IA, vous pouvez désormais utiliser Spark pour tous ces cas d'utilisation.
Le RTM a déjà été adopté par des équipes d'organisations leaders de l'industrie dans les services financiers, le commerce électronique, les médias et la technologie publicitaire pour alimenter la détection de fraude, la personnalisation en direct, le calcul de caractéristiques ML et l'attribution publicitaire.
Coinbase, l'une des principales plateformes d'échange de cryptomonnaies au monde, utilise le RTM pour faire évoluer ses moteurs de gestion des risques et de détection de fraude à haute fréquence — traitant des volumes massifs d'événements blockchain et d'échange avec la latence inférieure à 100 ms nécessaire pour sécuriser des millions de transactions d'actifs numériques.
En tirant parti du mode temps réel dans Spark Structured Streaming, nous avons obtenu une réduction de plus de 80 % des latences de bout en bout, atteignant des P99 inférieures à 100 ms, et rationalisé notre stratégie ML en temps réel à grande échelle. Ces performances nous permettent de calculer plus de 250 caractéristiques ML, le tout alimenté par un moteur Spark unifié.”—Daniel Zhou, Senior Staff Machine Learning Platform Engineer, Coinbase
DraftKings, l'une des plus grandes plateformes de paris sportifs et de fantasy sports d'Amérique du Nord, utilise le mode temps réel pour alimenter le calcul de caractéristiques pour ses modèles de détection de fraude — traitant des flux d'événements de paris à haut débit avec la latence et la fiabilité requises pour les décisions de paris en argent réel.
Dans les paris sportifs en direct, la détection de fraude exige une vitesse extrême. L'introduction du mode temps réel, associée à l'API transformWithState dans Spark Structured Streaming, a changé la donne pour nous. Nous avons obtenu des améliorations substantielles à la fois en termes de latence et de conception de pipeline, et pour la première fois, nous avons construit des pipelines de caractéristiques unifiés pour l'entraînement ML et l'inférence en ligne, atteignant des latences ultra-faibles qui n'étaient tout simplement pas possibles auparavant.”—Maria Marinova, Sr. Lead Software Engineer, DraftKings
MakeMyTrip, l'une des principales plateformes de voyage en ligne en Inde pour les hôtels, les vols et les expériences, a adopté le mode temps réel pour alimenter les expériences de recherche personnalisées. Le RTM a traité un grand volume de recherches d'utilisateurs pour fournir des recommandations en temps réel.
Dans la recherche de voyages, chaque milliseconde compte. En tirant parti du mode temps réel Spark (RTM), nous avons offert des expériences personnalisées avec des latences P50 inférieures à 50 ms, entraînant une augmentation de 7 % des taux de clics. Le RTM a également transformé nos opérations de données, permettant une architecture unifiée où Spark gère tout, de l'ETL à haut débit aux pipelines à latence ultra-faible. Alors que nous entrons dans l'ère des agents IA, les piloter efficacement nécessite de construire un contexte en temps réel à partir de flux de données. Nous expérimentons le RTM de Spark pour fournir à nos agents le contexte le plus riche et le plus récent nécessaire pour prendre les meilleures décisions possibles. —Aditya Kumar, Associate Director of Engineering, MakeMyTrip
Le RTM peut prendre en charge toutes les charges de travail qui bénéficient de la transformation des données en décisions en quelques millisecondes. Voici quelques exemples de cas d'utilisation :
Le RTM est une évolution du moteur Spark Structured Streaming qui lui permet d'atteindre des performances inférieures à la seconde dans des benchmarks de charges de travail exigeantes de calcul de caractéristiques clients.
Le mode micro-batch (MBM) par défaut de Structured Streaming est comme un bus navette d'aéroport qui attend qu'un certain nombre de passagers montent avant de partir. D'autre part, le RTM fonctionne comme un tapis roulant à grande vitesse, éliminant la limitation d'attendre que la navette soit pleine. Le RTM traite chaque événement à son arrivée, fournissant une latence de bout en bout de l'ordre de la milliseconde sans quitter l'écosystème Spark.

De secondes à millisecondes : Le RTM transforme le moteur Spark en remplaçant le batching périodique par un flux de données continu, éliminant les goulots d'étranglement de latence de l'ETL traditionnel.
Les gains de performance du RTM proviennent de trois innovations architecturales clés :
Ensemble, elles transforment Spark en un moteur haute performance et à faible latence capable de gérer les cas d'utilisation opérationnels les plus exigeants.
Afin de valider les performances de Spark RTM, nous avons comparé ses performances à celles d'un moteur spécialisé populaire, Apache Flink, sur la base de charges de travail réelles de calcul de caractéristiques clients. Ces modèles de calcul de caractéristiques sont représentatifs de la plupart des cas d'utilisation ETL à faible latence, tels que la détection de fraude, la personnalisation et l'analyse opérationnelle. En comparant Spark RTM à Flink, les résultats démontrent que l'architecture évoluée de Spark offre un profil de latence comparable aux frameworks de streaming spécialisés. Pour plus d'informations sur les ensembles de données et les requêtes référencés, consultez ce dépôt GitHub.

Un moteur, jusqu'à 92 % plus rapide : Le RTM surpasse les moteurs spécialisés comme Flink, prouvant que l'analyse opérationnelle de l'ordre de la milliseconde ne nécessite plus de moteur de streaming distinct. Source : Benchmarks internes basés sur des modèles de calcul de caractéristiques clients. Requêtes complètes disponibles sur GitHub.
Bien que la vitesse brute soit importante, le plus grand avantage de Spark RTM par rapport à des moteurs comme Flink réside dans la simplicité qu'il offre aux développeurs. Il permet aux équipes d'utiliser la même API Spark pour l'entraînement batch et l'inférence en temps réel, éliminant ainsi efficacement la "dérive logique" et la duplication du code. Spark RTM permet une évolutivité transparente, où un changement de code d'une seule ligne peut faire passer un pipeline de batches horaires à du streaming inférieur à la seconde sans réglage manuel de l'infrastructure. En fin de compte, en réduisant la complexité opérationnelle et le besoin de plusieurs systèmes spécialisés, les équipes peuvent développer et déployer des applications en temps réel beaucoup plus rapidement avec Spark RTM.
La mise en route avec le RTM est simple. Si vous utilisez déjà Structured Streaming, vous pouvez l'activer avec une seule mise à jour de configuration — aucune réécriture n'est nécessaire.
Le RTM est actuellement disponible sur les calculs Classic, dans les modes d'accès Dédicacé et Standard. Le RTM est pris en charge sur Databricks Runtime (DBR) 16.4 et supérieur ; cependant, nous recommandons DBR 18.1 pour les dernières fonctionnalités et optimisations. Lors de la création du cluster, ajoutez la configuration Spark suivante :
Depuis son lancement en aperçu public en août 2025, Databricks a continué d'étendre les capacités du RTM, en se basant sur les commentaires des clients.
Voici les nouveautés de cette version GA :
Le mode temps réel (RTM) étend Apache Spark Structured Streaming à une nouvelle catégorie de charges de travail : les applications opérationnelles sensibles à la latence qui exigent une réponse immédiate aux données de streaming. En apportant une latence inférieure à la seconde aux API Spark que votre équipe utilise déjà, il élimine le besoin d'exploiter un moteur spécialisé distinct pour vos pipelines les plus critiques en termes de temps. Que vous construisiez des pipelines de détection de fraude, des moteurs de personnalisation ou des systèmes de calcul de caractéristiques ML, le mode temps réel vous offre la latence dont votre application a besoin, avec la simplicité et l'étendue de l'écosystème Spark.
Consultez les ressources suivantes pour commencer dès aujourd'hui avec le mode temps réel (RTM) :
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
