Revenir au contenu principal

Qu'est-ce que le streaming structuré ?

Apprenez à traiter des données en temps réel à l'aide des mêmes API Spark que celles utilisées pour le traitement par lots.

10 Personas Application Development

Summary

  • Découvrez le Structured Streaming et comment il offre une API de haut niveau pour le traitement de flux dans Apache Spark.
  • Apprenez à convertir des tâches par lots en flux continu avec un minimum de modifications de code pour une latence réduite et un traitement incrémental.
  • Explorez comment le Structured Streaming simplifie le traitement des données en temps réel grâce aux API structurées Spark que vous connaissez déjà.

Le streaming structuré est une API de haut niveau pour le traitement des flux qui a été mise en production dans Spark 2.2. Le streaming structuré vous permet d’utiliser les API structurées de Spark pour exécuter des opérations en mode streaming, de la même façon que vous le feriez en mode batch. Cela peut réduire le temps de latence et permettre un traitement incrémental. Son atout majeur est qu’il permet d’exploiter les systèmes de streaming pour rapidement créer de la valeur, sans avoir besoin de modifier le code. Il est également facile à comprendre, car vous pouvez écrire votre job par batchs comme un prototype avant de le convertir en un job de streaming. Tout cela fonctionne par traitement incrémentiel de ces données.

UN LEADER 5X

Gartner® : Databricks, leader des bases de données cloud

Ressources complémentaires

Ne manquez jamais un article Databricks

Abonnez-vous à notre blog et recevez les derniers articles dans votre boîte mail.