Ir para o conteúdo principal

O que é o Apache Spark como serviço?

Apache Spark otimizado na nuvem como clusters prontos para uso para processamento em lote, SQL, streaming, aprendizado de máquina e computação gráfica, sem necessidade de gerenciamento de infraestrutura.

4 Personas Analytics AIBI 2a

Summary

  • Aproveita os recursos do Spark para streaming de dados, computação gráfica, SQL no Hadoop e aprendizado de máquina com aplicativos integrados, acelerando o acesso e a análise de dados em processamento distribuído em larga escala.
  • Elimina desafios de infraestrutura e acelera a implantação, removendo custos de hardware e barreiras à adoção em larga escala, ideal para projetos de análise de curto prazo com alto ROI e necessidades temporárias de exploração de dados.
  • Fornece acesso fácil a dados do Hive, HDFS, HBase e Amazon S3 sem habilidades de programação especializadas, permitindo que usuários técnicos e de negócios aproveitem a análise de big data antes de investir em sistemas completos.

O que é o Apache Spark como serviço?

O Apache Spark é uma estrutura de computação de cluster de código aberto para processamento rápido de dados em grande escala em tempo real. Desde o início em 2009, no AMPLab da UC Berkeley, o Spark teve um grande crescimento. Atualmente, ele é classificado como as maiores comunidades de código aberto em big data e conta com mais de 200 colaboradores de mais de 50 organizações. A Databricks hospeda sua versão otimizada do Apache Spark na forma de Spark como serviço em várias nuvens. Ele vem com um conjunto de aplicativos integrados que podem ajudar você a acessar e analisar dados mais rapidamente. Ele aproveita os inúmeros recursos do Spark de operar em big data, como sua capacidade de trabalhar com streaming de dados, executar computação de gráficos, oferecer SQL no Hadoop, bem como sua funcionalidade de machine learning. Embora a maioria das organizações tenha reconhecido as oportunidades que o Spark oferece, muitas ainda enfrentam dificuldades. Por quê? Devido aos desafios enfrentados pelas organizações ao tentar analisar fluxos de dados ou grandes quantidades de dados.  No entanto, isso não significa que você não possa aproveitar os benefícios que o Spark traz sem os investimentos em hardware e a adoção e implementação em grande escala. O Spark como serviço elimina os desafios da infraestrutura e acelera o processo, cortando a maioria dos custos e dos esforços necessários. Vários provedores já oferecem o Spark como serviço, tornando essa estrutura fácil e rápida de implantar. Essa solução funciona muito bem para projetos de análise de dados de curto prazo que podem ser configurados rapidamente com um alto retorno sobre o investimento. Com o Spark como serviço, é mais fácil processar e fazer query de dados armazenados no Hive, HDFS, HBase e Amazon S3. O Spark como serviço seja provavelmente a melhor opção se você tiver um projeto de análise temporário. Ele também provou ser a opção preferida para empresas que procuram ver as vantagens de usar big data e análise antes de fazer grandes investimentos em seu próprio sistema de processamento de big data.

UM LÍDER 5X

Gartner®: Databricks, líder em banco de dados em nuvem

Principais vantagens de usar o Spark como serviço:

Vantagens de usar o Spark como serviço

  • Maneira fácil de acessar dados do Spark
  • Não são necessárias habilidades de codificação especializadas; como resultado, ele pode ser facilmente usado por usuários técnicos e comerciais
  • custos mais baixos

Apache Spark como serviço: introdução fácil ao Spark

Recursos adicionais

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada

O que vem a seguir?

4 Personas Analytics AIBI 3a

Fundamentos de Data + AI

17 min de leitura

O que é Narrativa de Dados?

4 Personas Analytics AIBI 2a

Fundamentos de Data + AI

16 min de leitura

O que é Extrair, Carregar e Transformar (ELT)?