Ir para o conteúdo principal

O que é Sparkr?

Execute programas R em escala usando o mecanismo de computação distribuída do Apache Spark com sintaxe R familiar.

4 Personas Analytics AIBI 4

Summary

  • O SparkR traz o poder da computação distribuída do Apache Spark para programadores R, usando a sintaxe familiar do R.
  • A maioria dos recursos do Spark para Python está disponível no SparkR, facilitando o trabalho com big data para usuários de R.
  • A ferramenta se integra perfeitamente aos ambientes R, permitindo que cientistas de dados escalem seus fluxos de trabalho R existentes.

O SparkR é uma ferramenta para executar o R no Spark. Ele segue os mesmos princípios de todas as outras ligações de linguagem do Spark. Para usar o SparkR, basta importá-lo para nosso ambiente e executar nosso código. É tudo muito semelhante à API do Python, mas ele segue a sintaxe do R em vez do Python. Na maioria das vezes, quase tudo o que está disponível no Python também está disponível no SparkR.
 

Recursos adicionais

UM LÍDER 5X

Gartner®: Databricks, líder em banco de dados em nuvem

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada