Ir al contenido principal

Aplicación destacada: Elasticsearch

Company Blog

Publicado: June 27, 2014

Socios3 min de lectura

Elasticsearch ahora "Certificado en Spark"

Ayudar a las empresas a obtener información valiosa a partir de sus datos, y de forma rápida, es fundamental para la misión de Elasticsearch. La capacidad de operar donde sea que una empresa almacene sus datos es, obviamente, fundamental para esa misión, y Hadoop es uno de los líderes en ofrecer una manera para que las empresas almacenen cantidades masivas de datos a escala. Durante el último año, hemos estado trabajando arduamente para llevar el poder de nuestro motor de búsqueda y análisis en tiempo real al ecosistema de Hadoop. Nuestro conector de Hadoop, Elasticsearch para Apache Hadoop, es compatible con las tres principales distribuciones de Hadoop (Cloudera, Hortonworks y MapR) y hoy ha alcanzado otro hito emocionante: la certificación de Spark.

Elasticsearch + Spark = Búsqueda enriquecida, información inmediata

Spark está emergiendo rápidamente como una herramienta popular de procesamiento y análisis para almacenes de datos tipo Hadoop y otros. Continuamos viéndolo en muchas de las distribuciones de Hadoop de nuestros clientes y más allá, y hemos estado trabajando junto con Databricks, así como con nuestras respectivas comunidades de código abierto, para ofrecer una mejor conectividad entre las dos tecnologías. La combinación de Elasticsearch con Spark agrega las capacidades de un motor de búsqueda completo que mejora el descubrimiento y la exploración de datos (ya sea en un entorno en vivo de cara al cliente o tras bambalinas para el análisis interno) al motor de procesamiento unificado de Spark. A través del soporte de Elasticsearch para Apache Hadoop Map/Reduce, las aplicaciones de Spark pueden interactuar con Elasticsearch tal como lo harían con un recurso HDFS, lo que les permite indexar y analizar datos de forma transparente y en tiempo real. Nuestra herramienta de visualización de datos, Kibana, también se puede usar para explorar cantidades masivas de datos en Elasticsearch a través de gráficos circulares, de barras, de dispersión, histogramas y más, que se pueden generar fácilmente.

Las empresas siguen adoptando Elasticsearch para ayudarlas a llegar a la última milla de sus implementaciones de Hadoop al ofrecer la capacidad de consultar, iterar y extraer información procesable de sus datos. Muchas de ellas pertenecen a sectores como el de la salud, las finanzas y las telecomunicaciones, y tienen cantidades de datos extremadamente grandes y sensibles que necesitan analizar. Elasticsearch para Apache Hadoop les permite acceder a los datos, como los archivos de registro, en minutos en lugar de horas, para que puedan detectar fraudes, identificar problemas de servicio y analizar el comportamiento del cliente, lo que les permite llegar a soluciones más rápido y les da a sus desarrolladores estrella las herramientas que necesitan para impactar directamente en los resultados de su negocio.

No podríamos estar más emocionados de tener oficialmente la “Certificación en Spark”; nuestro conector de Hadoop es el primer paso en nuestra hoja de ruta para que los dos estén integrados de forma más nativa, brindando a las empresas capacidades de búsqueda y análisis aún más avanzadas para sus datos.

Descúbrenos

Si vas a asistir al Spark Summit, Holden Karau de Databricks mostrará cómo optimizar la indexación de búsqueda con Elasticsearch y Spark en esta sesión el lunes 30 de junio a las 3:00 p. m.

También realizaremos un seminario web sobre cómo se puede usar Elasticsearch para obtener información valiosa en tiempo real en sus implementaciones de Hadoop y Spark el miércoles 20 de agosto. Puede registrarse aquí.

Y por último, pero no por ello menos importante, si desea comenzar, descargue Elasticsearch para Apache Hadoop aquí y cuéntenos qué le parece.

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.

¿Qué sigue?

Databricks Named a Leader in 2024 Gartner® Magic Quadrant™ for Cloud Database Management Systems

Notícias

December 23, 2024/8 min de leitura

Databricks nomeada líder no Quadrante Mágico da Gartner® de 2024 para sistemas de gerenciamento de banco de dados em nuvem

How HP is optimizing the 3D Printing supply chain using Delta Sharing

Clientes

January 2, 2025/7 min de leitura

Como a HP está otimizando a cadeia de suprimentos de impressão 3D usando o Delta Sharing