API di Pandas con Back End Spark (Koalas)

Tipo di Demo

Tutorial sul Prodotto

Durata

Autogestita

Social

Che cosa imparerai

Nonostante sia uno dei framework più popolari per l'analisi dei dati, pandas non è distribuito e non può elaborare TB di dati. Databricks risolve questo problema permettendo agli utenti di sfruttare l'API di pandas mentre elaborano i dati con il motore distribuito Spark. Questa demo ti mostra come elaborare grandi quantità di dati utilizzando l'API di pandas (precedentemente conosciuta come Koalas).

 

Per installare la demo, ottieni un spazio di lavoro Databricks gratuito ed esegui i seguenti due comandi in un notebook Python

%pip installa dbdemos
python(Auto-detected)
importa dbdemos
dbdemos.install('pandas-on-spark')

Dbdemos è una libreria Python che installa demo complete di Databricks nei tuoi spazi di lavoro. Dbdemos caricherà e avvierà notebook, pipeline Delta Live Tables, cluster, dashboard Databricks SQL, modelli di warehouse ... Vedi come utilizzare dbdemos

 

Dbdemos è distribuito come un progetto GitHub.

Per ulteriori dettagli, si prega di visualizzare il file GitHub README.md e seguire la documentazione.
Dbdemos è fornito così com'è. Consulta la 
Licenza e Avviso per ulteriori informazioni.
Databricks non offre supporto ufficiale per dbdemos e gli asset associati.
Per qualsiasi problema, si prega di aprire un ticket e il team della demo darà un'occhiata nel miglior modo possibile.