Spark Streaming — Avançado

Tipo de Demonstração

Tutorial do Produto

Duração

Individualizado

Social

O que você vai aprender

A Plataforma Lakehouse da Databricks simplifica drasticamente o streaming de dados para fornecer análises em tempo real, aprendizado de máquina e aplicações em uma única plataforma. Nesta demonstração, apresentaremos como o Databricks Lakehouse fornece capacidades de streaming para ingerir e analisar dados de fluxo de cliques (normalmente de filas de mensagens como o Kafka).

A sessão é o processo de encontrar sessões de usuário limitadas pelo tempo a partir de um fluxo de eventos, agrupando todos os eventos que acontecem ao mesmo tempo (por exemplo, número de cliques, páginas mais visualizadas, etc.)

Compreender sessões é crucial para muitos casos de uso:

  • Detecte o abandono de carrinho na sua loja online e acione automaticamente ações de marketing como acompanhamento para aumentar suas vendas
  • Construa melhores modelos de atribuição para sua afiliação, com base nas ações do usuário durante cada sessão
  • Entenda a jornada do usuário em seu site e ofereça uma melhor experiência para aumentar a retenção de usuários

Nesta demonstração, nós iremos:

  • Ingerir dados do Kafka
  • Salve os dados como tabelas Delta, garantindo qualidade e desempenho em grande escala
  • Calcule as sessões de usuários com base na atividade

 

Para instalar a demonstração, obtenha uma área de trabalho Databricks gratuita e execute os dois comandos seguintes em um notebook Python.

%pip instale dbdemos
import dbdemos
dbdemos.install('streaming-sessionization')

Dbdemos é uma biblioteca Python que instala demonstrações completas do Databricks em seus espaços de trabalho. Dbemos carregará e iniciará notebooks, pipelines do Delta Live Tables, clusters, painéis do Databricks SQL, modelos de armazém... Veja como usar dbdemos

 

Dbdemos é distribuído como um projeto do GitHub.

Para mais detalhes, por favor, veja o GitHub arquivo README.md e siga a documentação.
Dbdemos é fornecido como está. Veja a 
Licença e Aviso para mais informações.
Databricks não oferece suporte oficial para dbdemos e os ativos associados.
Para qualquer problema, por favor, abra um ticket e a equipe de demonstração dará uma olhada com base no melhor esforço. 

Recomendado

<p>Pipeline Completo de Tabelas Delta ao Vivo — Empréstimo</p>

Tutorial

Pipeline Completo de Tabelas Delta ao Vivo — Empréstimo

<p>CDC Pipeline Com Delta Live Tables</p>

Tutorial

CDC Pipeline Com Delta Live Tables

<p><span><span><span><span><span><span>Delta Lake</span></span></span></span></span></span></p>

Tutorial

Delta Lake