Spark Streaming — Avanzato

Tipo di Demo

Tutorial sul Prodotto

Durata

Autogestita

Social

Che cosa imparerai

La piattaforma Lakehouse di Databricks semplifica notevolmente lo streaming dei dati per fornire analisi in tempo reale, apprendimento automatico e applicazioni su una sola piattaforma. In questa demo, presenteremo come il Lakehouse di Databricks fornisce capacità di streaming per ingerire e analizzare i dati del clickstream (tipicamente da code di messaggi come Kafka).

La sessionizzazione è il processo di ricerca di sessioni utente limitate nel tempo da un flusso di eventi, raggruppando tutti gli eventi che si verificano nello stesso periodo (ad esempio, numero di clic, pagine più visualizzate, ecc.)

Comprendere le sessioni è fondamentale per molti casi d'uso:

  • Rileva l'abbandono del carrello nel tuo negozio online e attiva automaticamente azioni di marketing come follow-up per aumentare le tue vendite
  • Costruisci modelli di attribuzione migliori per la tua affiliazione, basati sulle azioni degli utenti durante ogni sessione
  • Comprendi il percorso dell'utente sul tuo sito web e fornisci un'esperienza migliore per aumentare la tua ritenzione degli utenti

In questa demo, faremo:

  • Ingestire dati da Kafka
  • Salva i dati come tabelle Delta, garantendo qualità e prestazioni su larga scala
  • Calcolare le sessioni utente in base all'attività

 

Per installare la demo, ottieni un workspace Databricks gratuito ed esegui i seguenti due comandi in un notebook Python.

%pip installa dbdemos
importa dbdemos
dbdemos.install('streaming-sessionization')

Dbdemos è una libreria Python che installa demo complete di Databricks nei tuoi spazi di lavoro. Dbemos caricherà e avvierà quaderni, pipeline di Delta Live Tables, cluster, cruscotti Databricks SQL, modelli di magazzino... Vedi come usare dbdemos

 

Dbdemos è distribuito come un progetto GitHub.

Per ulteriori dettagli, si prega di consultare il file README.md su GitHub e seguire la documentazione.
Dbdemos è fornito così com'è. Consulta la 
Licenza e il Avviso per ulteriori informazioni.
Databricks non offre supporto ufficiale per dbdemos e gli asset associati.
Per qualsiasi problema, si prega di aprire un ticket e il team di demo esaminerà la questione nel miglior modo possibile. 

Consigli

<p>Pipeline Completo di Tabelle Live Delta — Prestito</p>

Tutorial

Pipeline Completo di Tabelle Live Delta — Prestito

<p>Pipeline CDC con Delta Live Tables</p>

Tutorial

Pipeline CDC con Delta Live Tables

<p><span><span><span><span><span><span>Delta Lake</span></span></span></span></span></span></p>

Tutorial

Delta Lake