Passa al contenuto principale

Cosa sono le applicazioni continue?

Come le applicazioni continue unificano lo streaming, il servizio, l'elaborazione batch e l'apprendimento automatico dietro un'unica interfaccia in modo che i sistemi possano reagire ai dati in tempo reale

10 Personas Business Intelligence

Summary

  • Scopri cosa sono le applicazioni continue e come consentono di creare sistemi end-to-end che reagiscono ai dati in tempo reale utilizzando un'unica interfaccia di programmazione.
  • Scopri come casi d'uso come il real-time serving, l'ETL, la creazione di versioni in streaming di processi batch e l'apprendimento automatico online possono essere tutti espressi in un'unica applicazione continua.
  • Scopri perché unificare streaming, storage, serving e batch dietro un'unica API riduce la complessità rispetto all'unione di più sistemi separati.

Le applicazioni continue sono applicazioni end-to-end che reagiscono ai dati in tempo reale. Per gli sviluppatori sarebbe auspicabile utilizzare un'unica interfaccia di programmazione per supportare i vari aspetti delle applicazioni continue che attualmente sono gestiti in sistemi separati, come l'esecuzione di query o l'interazione con i batch job. Le applicazioni continue sono in grado di gestire, tra gli altri, i seguenti casi d'uso:

  • Aggiornamento dei dati che verranno serviti in tempo reale. Lo sviluppatore potrebbe scrivere una singola applicazione Spark che gestisce sia gli aggiornamenti sia il servizio (ad esempio attraverso il server JDBC di Spark), oppure utilizzare un'API che esegue automaticamente aggiornamenti transazionali su un sistema di servizio come MySQL, Redis o Apache Cassandra.
  • Estrazione, trasformazione e caricamento dei dati (ETL). Lo sviluppatore dovrebbe semplicemente elencare le trasformazioni richieste come in un batch job, e il sistema di streaming gestirebbe il coordinamento con entrambi i sistemi di archiviazione per garantire l'elaborazione exactly-once.
  • Creare una versione in tempo reale di un batch job esistente. Il sistema di streaming garantirebbe risultati sempre coerenti in un batch job sugli stessi dati.
  • Machine learning online. La libreria di machine learning (MLlib) sarebbe progettata per combinare l'addestramento in tempo reale, l'addestramento periodico in batch e il servizio di predizione usando la stessa API.
LEADER PER LA 5ª VOLTA

Gartner®: Databricks leader dei database cloud

Applicazioni continue

Risorse aggiuntive

Non perdere mai un post di Databricks

Iscriviti al nostro blog e ricevi gli ultimi post direttamente nella tua casella di posta elettronica.