Revenir au contenu principal

Pleins feux sur l'application : Elasticsearch

Company Blog

Published: June 27, 2014

Partenaires3 min de leitura

Elasticsearch est désormais « Certifié sur Spark »

Aider les entreprises à tirer rapidement des insights de leurs données est au cœur de la mission d'Elasticsearch. La capacité à s'intégrer partout où une entreprise stocke ses données est évidemment essentielle à cette mission, et Hadoop est l'un des leaders pour fournir aux entreprises un moyen de stocker des quantités massives de données à grande échelle. Au cours de l'année écoulée, nous avons travaillé d'arrache-pied pour apporter la puissance de notre moteur de recherche et d'analyse en temps réel à l'écosystème Hadoop. Notre connecteur Hadoop, Elasticsearch pour Apache Hadoop, est compatible avec les trois principales distributions Hadoop (Cloudera, Hortonworks et MapR) et a franchi aujourd'hui une nouvelle étape passionnante : la certification Spark.

Elasticsearch + Spark = Recherche enrichie, insights immédiats

Spark s'impose rapidement comme un outil de traitement et d'analyse populaire pour les entrepôts de données de type Hadoop et autres. Nous continuons de le voir dans de nombreuses distributions Hadoop de nos clients et au-delà, et nous travaillons en collaboration avec Databricks ainsi qu'avec nos communautés open source respectives pour apporter une meilleure connectivité entre les deux technologies. La combinaison d'Elasticsearch avec Spark ajoute les capacités d'un moteur de recherche à part entière qui améliore la découverte et l'exploration des données (que ce soit dans un environnement en direct, destiné aux clients, ou en coulisses pour une analyse interne) au moteur de traitement unifié de Spark. Grâce au support Map/Reduce d'Elasticsearch pour Apache Hadoop, les applications Spark peuvent interagir avec Elasticsearch exactement comme elles le feraient avec une ressource HDFS, ce qui leur permet d'indexer et d'analyser des données de manière transparente, en temps réel. Notre outil de visualisation de données, Kibana, peut également être utilisé pour explorer des quantités massives de données dans Elasticsearch grâce à des graphiques en secteurs, des diagrammes à barres, des nuages de points, des histogrammes et plus encore, faciles à générer.

Les entreprises continuent d'adopter Elasticsearch pour les aider à franchir le dernier kilomètre de leurs déploiements Hadoop en leur donnant la possibilité de poser des questions, d'itérer et d'extraire des informations exploitables de leurs données. Beaucoup d'entre elles opèrent dans des secteurs d'activité comme la santé, la finance et les télécommunications, et doivent exploiter des quantités de données extrêmement volumineuses et sensibles. Elasticsearch pour Apache Hadoop leur permet d'accéder aux données, comme les fichiers log, en quelques minutes au lieu de quelques heures, afin qu'elles puissent détecter les fraudes, identifier les problèmes de service et analyser le comportement des clients. Elles peuvent ainsi trouver des solutions plus rapidement et donner à leurs développeurs vedettes les outils dont ils ont besoin pour avoir un impact direct sur les résultats de leur entreprise.

Nous ne pourrions être plus ravis d'être officiellement « Certifiés sur Spark ». Notre connecteur Hadoop est la première étape de notre Feuille de route pour rendre les deux plus intégrés en mode natif, offrant aux entreprises des capacités de recherche et d'analytique encore plus avancées pour leurs données.

Pour en savoir plus

Si vous participez au Spark Summit, Holden Karau de Databricks montrera comment rationaliser l'indexation de recherche avec Elasticsearch et Spark lors de cette session le lundi 30 juin à 15h00.

Nous organisons également un webinar sur la manière dont Elasticsearch peut être utilisé pour obtenir des insights en temps réel sur vos déploiements Hadoop et Spark le mercredi 20 août. Vous pouvez vous inscrire ici.

Enfin et surtout, si vous souhaitez vous lancer, téléchargez Elasticsearch pour Apache Hadoop ici et dites-nous ce que vous en pensez !

Ne manquez jamais un article Databricks

Abonnez-vous à notre blog et recevez les derniers articles dans votre boîte mail.

Et ensuite ?

Databricks Named a Leader in 2024 Gartner® Magic Quadrant™ for Cloud Database Management Systems

Notícias

December 23, 2024/8 min de leitura

Databricks nomeada líder no Quadrante Mágico da Gartner® de 2024 para sistemas de gerenciamento de banco de dados em nuvem

How HP is optimizing the 3D Printing supply chain using Delta Sharing

Clientes

January 2, 2025/7 min de leitura

Como a HP está otimizando a cadeia de suprimentos de impressão 3D usando o Delta Sharing