주요 컨텐츠로 이동

SparkR란 무엇인가요?

Databricks 무료로 시작하기

SparkR은 Apache Spark에서 R 언어를 사용해 대규모 데이터를 분산 처리할 수 있도록 지원하는 도구입니다.

Spark의 다른 언어 바인딩과 동일한 원칙을 적용하며, 환경 설정 후 바로 코드를 작성해 실행할 수 있습니다. 전체 구조는 Python API와 거의 유사하지만, R 고유의 문법을 따른다는 점에서 차이가 있습니다.

일반적으로 Python API에서 제공하는 기능은 대부분 SparkR에서도 활용할 수 있습니다.

추가 자료

용어집으로 돌아가기