API do Pandas com Back End do Spark (Koalas)

Tipo de Demonstração

Tutorial do Produto

Duração

Individualizado

Social

O que você vai aprender

Apesar de ser uma das estruturas mais populares para análise de dados, pandas não é distribuído e não pode processar TB de dados. Databricks resolve esse problema permitindo que os usuários aproveitem a API pandas enquanto processam os dados com o motor distribuído Spark. Esta demonstração mostra como processar big data usando a API pandas (anteriormente conhecida como Koalas).

 

Para instalar a demonstração, obtenha um workspace Databricks gratuito e execute os dois comandos seguintes em um notebook Python

%pip instale dbdemos
python(Auto-detected)
import dbdemos
dbdemos.install('pandas-on-spark')

Dbdemos é uma biblioteca Python que instala demonstrações completas do Databricks em seus espaços de trabalho. Dbdemos irá carregar e iniciar notebooks, pipelines Delta Live Tables, clusters, painéis Databricks SQL, modelos de armazém ... Veja como usar dbdemos

 

Dbdemos é distribuído como um projeto do GitHub.

Para mais detalhes, por favor, veja o GitHub arquivo README.md e siga a documentação.
Dbdemos é fornecido como está. Veja a 
Licença e Aviso para mais informações.
Databricks não oferece suporte oficial para dbdemos e os ativos associados.
Para qualquer problema, por favor, abra um ticket e a equipe de demonstração dará uma olhada com base no melhor esforço.