Direkt zum Hauptinhalt

Anwendungs-Spotlight: Elasticsearch

Company Blog

Published: June 27, 2014

Partner3 min de leitura

Elasticsearch jetzt „für Spark zertifiziert“

Unternehmen dabei zu helfen, schnell Erkenntnisse aus ihren Daten zu gewinnen, ist ein Kernanliegen von Elasticsearch. Die Fähigkeit, überall dort zu laufen, wo ein Unternehmen seine Daten speichert, ist für diese Mission natürlich von entscheidender Bedeutung, und Hadoop ist einer der führenden Anbieter, der Unternehmen eine Möglichkeit bietet, riesige Datenmengen auf Scale zu speichern. Im Laufe des letzten Jahres haben wir hart daran gearbeitet, die Leistungsfähigkeit unserer Echtzeit-Such- und Analyse-Engine in das Hadoop-Ökosystem zu bringen. Unser Hadoop-Konnektor, Elasticsearch for Apache Hadoop, ist mit den drei führenden Hadoop-Distributionen – Cloudera, Hortonworks und MapR – kompatibel und hat heute einen weiteren spannenden Meilenstein erreicht: die Spark-Zertifizierung.

Elasticsearch + Spark = Umfassende Suche, sofortige Einblicke

Spark entwickelt sich schnell zu einem beliebten Verarbeitungs- und Analysetool für Hadoop-ähnliche und andere Datenspeicher. Wir sehen sie weiterhin in vielen Hadoop-Distributionen unserer Kunden und darüber hinaus und haben mit Databricks sowie unseren jeweiligen Open-Source-Communitys zusammengearbeitet, um eine bessere Konnektivität zwischen den beiden Technologien herzustellen. Die Kombination von Elasticsearch mit Spark erweitert die einheitliche Verarbeitungs-Engine von Spark um die Funktionen einer vollwertigen Suchmaschine, die die Data Discovery und -erkundung verbessert – sei es in einer Live-Umgebung mit Kundenkontakt oder im Hintergrund für interne Analysen. Mit der Map/Reduce-Unterstützung von Elasticsearch für Apache Hadoop können Spark-Anwendungen mit Elasticsearch genauso wie mit einer HDFS -Ressource interagieren und so Daten transparent und in Echtzeit indizieren und analysieren. Unser Datenvisualisierungstool Kibana kann auch dazu verwendet werden, riesige Datenmengen in Elasticsearch mithilfe von einfach zu erstellenden Tortendiagrammen, Balkendiagrammen, Streudiagrammen, Histogrammen und mehr zu erkunden.

Unternehmen setzen weiterhin auf Elasticsearch, um die letzte Meile ihrer Hadoop-Deployments zu bewältigen, indem es die Möglichkeit bietet, ihre Daten abzufragen, zu iterieren und handlungsrelevante Erkenntnisse daraus zu gewinnen. Viele von ihnen sind in Branchen wie dem Gesundheitswesen, dem Finanzwesen und der Telekommunikation tätig und verfügen über extrem große und sensible Datenmengen, die sie auswerten müssen. Mit Elasticsearch für Apache Hadoop können sie auf Daten, wie z. B. Logdateien, in Minuten statt in Stunden zugreifen, sodass sie Betrug erkennen, Dienstprobleme identifizieren und das Kundenverhalten analysieren können. Dadurch gelangen sie schneller zu Lösungen und ihre Rockstar-Entwickler erhalten die Tools, die sie benötigen, um das Geschäftsergebnis direkt zu beeinflussen.

Wir sind hocherfreut, offiziell „Certified on Spark“ zu sein; unser Hadoop-Connector ist der erste Schritt auf unserer Roadmap, um die beiden nativ zu integrieren und Unternehmen noch fortschrittlichere Such- und Analytics-Funktionen für ihre Daten zu bieten.

Lernen Sie uns kennen

Wenn Sie am Spark Summit teilnehmen, zeigt Ihnen Holden Karau von Databricks am Montag, den 30. Juni, um 15:00 Uhr in dieser Session, wie Sie die Suchindizierung mit Elasticsearch und Spark optimieren können.

Am Mittwoch, den 20. August, veranstalten wir außerdem ein Webinar darüber, wie Elasticsearch für Echtzeit-Einblicke in Ihre Hadoop- und Spark-Deployments genutzt werden kann. Sie können sich hier dafür registrieren.

Und zu guter Letzt: Wenn Sie loslegen möchten, laden Sie Elasticsearch für Apache Hadoop hier herunter und teilen Sie uns Ihre Meinung mit!

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Was kommt als Nächstes?

Databricks Named a Leader in 2024 Gartner® Magic Quadrant™ for Cloud Database Management Systems

Notícias

December 23, 2024/8 min de leitura

Databricks nomeada líder no Quadrante Mágico da Gartner® de 2024 para sistemas de gerenciamento de banco de dados em nuvem

How HP is optimizing the 3D Printing supply chain using Delta Sharing

Clientes

January 2, 2025/7 min de leitura

Como a HP está otimizando a cadeia de suprimentos de impressão 3D usando o Delta Sharing