Direkt zum Hauptinhalt

Spark auf Databricks

Die beste Plattform zur Ausführung Ihrer Spark-Workloads – von den ursprünglichen Entwicklern von Apache Spark™

Einfachheit, erstklassige operative Exzellenz und das Preis-Leistungs-Verhältnis machen die Databricks Lakehouse Platform zur besten Lösung für die Ausführung Ihrer Apache Spark™-Workloads

Erstklassige operative Exzellenz

Wir helfen Tausenden von Kunden jeden Tag Millionen von VMs zu starten, um ihre Spark-Anwendungen auszuführen. Und wir unterstützen die neuesten Entwicklertools und Anleitungen, um sicherzustellen, dass Sie Ihre Spark-Anwendungen sicher und einfach entwickeln und bereitstellen können.

  • Führen Sie Ihre Spark-Anwendungen einzeln aus oder stellen Sie sie problemlos in Databricks Workflows bereit.
  • Führen Sie Spark-Notebooks mit anderen Tasktypen für deklarative Datenpipelines auf vollständig verwalteten Compute-Ressourcen aus.
  • Mit dem Workflow-Monitoring können Sie die Performance Ihrer Spark-Anwendungen im Laufe der Zeit einfach verfolgen und Probleme mit wenigen Klicks diagnostizieren.

Bestes Preis-Leistungs-Verhältnis für Spark-Workloads

Wenn Sie Ihre Spark-Workloads auf der Databricks Lakehouse Platform ausführen, profitieren Sie von Photon – einer schnellen, vektorisierten C++-Ausführungs-Engine für Spark- und SQL-Workloads, die hinter den vorhandenen Programmierschnittstellen von Spark läuft. Photon bietet rekordverdächtige Performance zu geringen Kosten und nutzt gleichzeitig die neuesten modernen Hardwarearchitekturen wie AWS Graviton.

Neben der blitzschnellen Performance erzielt Spark in Databricks durch Funktionen wie dynamische Autoskalierung niedrigere Gesamtbetriebskosten, sodass Sie nur für das bezahlen, was Sie nutzen. Databricks bietet auch GPU- und Spot-Instances.

End-to-End Analytics und einheitliche Governance mit der Databricks Lakehouse Platform

Während andere Plattformen die Integration mehrerer Tools und die Verwaltung verschiedener Governance-Modelle erfordern, vereint Databricks Data Warehouse, Data Lake und Data Streaming auf einer einfachen Lakehouse-Plattform, um alle Ihre Data Engineering-, Analytics- und KI-Anwendungsfälle durchgängig zu verwalten. Sie basiert auf einer offenen und zuverlässigen Datengrundlage, die alle Datentypen effizient verarbeitet, Batch und Streaming vereinheitlicht und ein gemeinsames Sicherheits- und Governance-Modell für alle Ihre Daten- und Cloud-Plattformen anwendet.

Kontinuierliche Innovation

Der SIGMOD Systems Award 2022 würdigte Spark als innovatives, weit verbreitetes, einheitliches Open-Source-Datenverarbeitungssystem, das relationale, Streaming- und Machine-Learning-Workloads umfasst.

Und die Innovation geht weiter. Kürzlich haben wir Spark Connect und Project Lightspeed vorgestellt.

Spark Connect entkoppelt Client und Server für eine bessere Stabilität und ermöglicht Spark-Anwendungen überall.

Project Lightspeed, die nächste Generation des strukturierten Spark-Streamings, bietet darüber hinaus vorhersehbare niedrige Latenzzeiten und verbesserte Funktionalität für die Verarbeitung von Ereignissen.