주요 컨텐츠로 이동

Sparkr란 무엇인가요?

익숙한 R 구문을 사용하여 Apache Spark의 분산 컴퓨팅 엔진으로 대규모 R 프로그램을 실행하세요.

4 Personas Analytics AIBI 4
데이터 + AI 기반Less than a minute

작성자: Databricks 직원

Summary

  • SparkR은 Apache Spark의 분산 컴퓨팅 기능을 익숙한 R 구문을 사용하여 R 프로그래머가 활용할 수 있도록 해줍니다.
  • Python Spark의 대부분 기능이 SparkR에서 제공되므로 R 사용자는 빅데이터를 손쉽게 처리할 수 있습니다.
  • 이 도구는 R 환경에 완벽하게 통합되어 데이터 과학자들이 기존 R 워크플로우를 확장할 수 있도록 지원합니다.

SparkR은 Apache Spark에서 R 언어를 사용해 대규모 데이터를 분산 처리할 수 있도록 지원하는 도구입니다.

5X 리더

Gartner®: Databricks 클라우드 데이터베이스 리더

Spark의 다른 언어 바인딩과 동일한 원칙을 적용하며, 환경 설정 후 바로 코드를 작성해 실행할 수 있습니다. 전체 구조는 Python API와 거의 유사하지만, R 고유의 문법을 따른다는 점에서 차이가 있습니다.

일반적으로 Python API에서 제공하는 기능은 대부분 SparkR에서도 활용할 수 있습니다.

추가 자료

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요