Ir para o conteúdo principal

Destaque do aplicativo: Elasticsearch

Company Blog

Published: June 27, 2014

Parceiros3 min de leitura

Elasticsearch: agora "Certified on Spark"

Ajudar as empresas a obter percepções de seus dados, rapidamente, é o cerne da missão do Elasticsearch. Poder operar onde quer que uma empresa armazene seus dados é obviamente fundamental para essa missão, e o Hadoop é um dos líderes no fornecimento de uma maneira para as empresas armazenarem grandes quantidades de dados em escala. Ao longo do último ano, temos trabalhado arduamente para levar o poder do nosso mecanismo de busca e analítica em tempo real para o ecossistema Hadoop. Nosso conector Hadoop, Elasticsearch for Apache Hadoop, é compatível com as três principais distribuições Hadoop – Cloudera, Hortonworks e MapR – e hoje alcançou outro marco importante: a certificação Spark.

Elasticsearch + Spark = Pesquisa avançada, percepções imediatas

O Spark está emergindo rapidamente como uma ferramenta popular de processamento e análise para data stores semelhantes ao Hadoop e outros. Continuamos a vê-lo em muitas das distribuições Hadoop dos nossos clientes e além, e temos trabalhado em conjunto com a Databricks, bem como com nossas respectivas comunidades de código aberto, para trazer uma melhor conectividade entre as duas tecnologias. A combinação do Elasticsearch com o Spark adiciona os recursos de um mecanismo de busca completo que aprimora o descobrimento e a exploração de dados — seja em um ambiente ativo e voltado para o cliente ou nos bastidores para análise interna — ao mecanismo de processamento unificado do Spark. Através do suporte do Elasticsearch para Apache Hadoop Map/Reduce, as aplicações Spark podem interagir com o Elasticsearch assim como fariam com um recurso HDFS, permitindo que eles indexem e analisem dados de forma transparente, em tempo real. Nossa ferramenta de visualização de dados, Kibana, também pode ser usada para explorar grandes quantidades de dados no Elasticsearch por meio de gráficos de pizza, gráficos de barras, gráficos de dispersão, histogramas e muito mais, fáceis de gerar.

As empresas continuam a adotar o Elasticsearch para ajudá-las a chegar à etapa final de suas implantações do Hadoop, fornecendo a capacidade de consultar, iterar e extrair percepções acionáveis de seus dados. Muitas delas estão em indústrias como saúde, finanças e telecomunicações e têm quantidades extremamente grandes e confidenciais de dados que precisam minerar. O Elasticsearch para Apache Hadoop permite que acessem dados, como arquivos de log, em minutos em vez de horas, para que possam detectar fraudes, identificar problemas de serviço e analisar o comportamento do cliente, permitindo que cheguem a resoluções mais rapidamente e dando aos seus desenvolvedores 'rockstar' as ferramentas de que precisam para impactar diretamente os resultados financeiros de seus negócios.

Não poderíamos estar mais entusiasmados em receber a certificação oficial “Certified on Spark”; nosso conector Hadoop é o primeiro passo em nosso roteiro para tornar os dois mais nativamente integrados, trazendo às empresas recursos ainda mais avançados de pesquisa e analítica para seus dados.

Confira

Se você for ao Spark Summit, Holden Karau, da Databricks, mostrará como otimizar a indexação de pesquisa com o Elasticsearch e o Spark nesta sessão na segunda-feira, 30 de junho, às 15:00.

Também realizaremos um webinar sobre como o Elasticsearch pode ser usado para entendimentos em tempo real em suas implantações do Hadoop e Spark na quarta-feira, 20 de agosto. Você pode se registrar aqui.

E por último, mas não menos importante, se você quiser começar, faça o download do Elasticsearch para Apache Hadoop aqui e diga-nos o que você acha!

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada

O que vem a seguir?

Databricks Named a Leader in 2024 Gartner® Magic Quadrant™ for Cloud Database Management Systems

Notícias

December 23, 2024/8 min de leitura

Databricks nomeada líder no Quadrante Mágico da Gartner® de 2024 para sistemas de gerenciamento de banco de dados em nuvem

How HP is optimizing the 3D Printing supply chain using Delta Sharing

Clientes

January 2, 2025/7 min de leitura

Como a HP está otimizando a cadeia de suprimentos de impressão 3D usando o Delta Sharing