Ayudar a las empresas a obtener información valiosa a partir de sus datos, y de forma rápida, es fundamental para la misión de Elasticsearch. La capacidad de operar donde sea que una empresa almacene sus datos es, obviamente, fundamental para esa misión, y Hadoop es uno de los líderes en ofrecer una manera para que las empresas almacenen cantidades masivas de datos a escala. Durante el último año, hemos estado trabajando arduamente para llevar el poder de nuestro motor de búsqueda y análisis en tiempo real al ecosistema de Hadoop. Nuestro conector de Hadoop, Elasticsearch para Apache Hadoop, es compatible con las tres principales distribuciones de Hadoop (Cloudera, Hortonworks y MapR) y hoy ha alcanzado otro hito emocionante: la certificación de Spark.
Spark está emergiendo rápidamente como una herramienta popular de procesamiento y análisis para almacenes de datos tipo Hadoop y otros. Continuamos viéndolo en muchas de las distribuciones de Hadoop de nuestros clientes y más allá, y hemos estado trabajando junto con Databricks, así como con nuestras respectivas comunidades de código abierto, para ofrecer una mejor conectividad entre las dos tecnologías. La combinación de Elasticsearch con Spark agrega las capacidades de un motor de búsqueda completo que mejora el descubrimiento y la exploración de datos (ya sea en un entorno en vivo de cara al cliente o tras bambalinas para el análisis interno) al motor de procesamiento unificado de Spark. A través del soporte de Elasticsearch para Apache Hadoop Map/Reduce, las aplicaciones de Spark pueden interactuar con Elasticsearch tal como lo harían con un recurso HDFS, lo que les permite indexar y analizar datos de forma transparente y en tiempo real. Nuestra herramienta de visualización de datos, Kibana, también se puede usar para explorar cantidades masivas de datos en Elasticsearch a través de gráficos circulares, de barras, de dispersión, histogramas y más, que se pueden generar fácilmente.
Las empresas siguen adoptando Elasticsearch para ayudarlas a llegar a la última milla de sus implementaciones de Hadoop al ofrecer la capacidad de consultar, iterar y extraer información procesable de sus datos. Muchas de ellas pertenecen a sectores como el de la salud, las finanzas y las telecomunicaciones, y tienen cantidades de datos extremadamente grandes y sensibles que necesitan analizar. Elasticsearch para Apache Hadoop les permite acceder a los datos, como los archivos de registro, en minutos en lugar de horas, para que puedan detectar fraudes, identificar problemas de servicio y analizar el comportamiento del cliente, lo que les permite llegar a soluciones más rápido y les da a sus desarrolladores estrella las herramientas que necesitan para impactar directamente en los resultados de su negocio.
No podríamos estar más emocionados de tener oficialmente la “Certificación en Spark”; nuestro conector de Hadoop es el primer paso en nuestra hoja de ruta para que los dos estén integrados de forma más nativa, brindando a las empresas capacidades de búsqueda y análisis aún más avanzadas para sus datos.
Si vas a asistir al Spark Summit, Holden Karau de Databricks mostrará cómo optimizar la indexación de búsqueda con Elasticsearch y Spark en esta sesión el lunes 30 de junio a las 3:00 p. m.
También realizaremos un seminario web sobre cómo se puede usar Elasticsearch para obtener información valiosa en tiempo real en sus implementaciones de Hadoop y Spark el miércoles 20 de agosto. Puede registrarse aquí.
Y por último, pero no por ello menos importante, si desea comenzar, descargue Elasticsearch para Apache Hadoop aquí y cuéntenos qué le parece.
Notícias
December 23, 2024/8 min de leitura
Clientes
January 2, 2025/7 min de leitura


