Passa al contenuto principale

Spark su Databricks

La piattaforma migliore per eseguire carichi di lavoro Spark, dai creatori originali di Apache Spark™

Semplicità, eccellenza operativa ai vertici del settore e benefici in termini di prezzo/prestazioni fanno della Databricks Lakehouse Platform l'ambiente migliore su cui eseguire i carichi di lavoro Apache Spark™

Best-in-class operational excellence

Eccellenza operativa ai vertici del settore

Aiutiamo migliaia di clienti a lanciare milioni di macchine virtuali (VM) ogni giorno per eseguire le loro applicazioni Spark. Inoltre, supportiamo gli strumenti e le guide per sviluppatori più avanzati, consentendo di sviluppare e implementare applicazioni Spark in modo semplice e affidabile.

  • Le applicazioni Spark possono essere eseguite singolarmente o implementate facilmente su Databricks Workflows
  • I notebook Spark possono essere eseguiti con altri tipi di compiti per pipeline di dati dichiarative su risorse di calcolo completamente gestite
  • Il monitoraggio del flusso di lavoro consente di tracciare facilmente le prestazioni delle applicazioni Spark nel tempo e diagnosticare i problemi con pochi clic
Best price/performance for Spark workloads

Il miglior rapporto prezzo/prestazioni per carichi di lavoro Spark

Eseguire i carichi di lavoro Spark sulla Databricks Lakehouse Platform significa beneficiare di  Photon , un veloce motore di esecuzione vettoriale C++ per carichi di lavoro Spark e SQL che gira dietro le interfacce di programmazione esistenti di Spark. Photon offre prestazioni di query da record a costi bassi, sfruttando al tempo stesso le architetture hardware più moderne come AWS Graviton.

Oltre alle prestazioni ad altissima velocità, Spark su Databricks assicura un TCO complessivo ridotto grazie a funzionalità come l'autodimensionamento dinamico, che consente di pagare "a consumo". Databricks offre inoltre istanze GPU e spot.

Databricks Lakehouse Platform

Analisi a 360 gradi e governance unificata con la Databricks Lakehouse Platform

Mentre altre piattaforme richiedono di integrare più strumenti e gestire diversi modelli di governance, Databricks unifica data warehouse, data lake e dati in streaming in un'unica, semplice piattaforma lakehouse per gestire tutti i casi d'uso di data engineering, analisi e AI. La soluzione è costruita su una piattaforma aperta e affidabile che gestisce in maniera efficiente tutti i tipi di dati, unifica batch e streaming, e applica un unico modello comune di sicurezza e governance, per tutti i dati e le piattaforme cloud.

Sigmod Awards

Innovazione continua

The 2022 SIGMOD Systems Award ha riconosciuto Spark come sistema open-source per l'elaborazione unificata dei dati innovativo e ampiamente diffuso, che comprende carichi di lavoro relazionali, in streaming e machine learning.

E l'innovazione continua. Recentemente abbiamo introdotto Spark Connect e Project Lightspeed.

Spark Connect disaccoppia il client e il server per aumentare la stabilità e consente di realizzare applicazioni Spark ovunque.

Project Lightspeed, la nuova generazione di Spark Structured Streaming, porta miglioramenti in termini di bassa latenza prevedibile e funzionalità avanzate per l'elaborazione di eventi.