주요 컨텐츠로 이동

Databricks Runtime이 무엇인가요?

Databricks 무료로 시작하기

Databricks Runtime은 Databricks에서 관리하는 머신 클러스터에서 실행되는 소프트웨어 아티팩트 세트입니다. 여기에는 Spark도 포함하지만 이외에도 여러 구성요소와 업데이트를 추가하여 빅데이터 분석의 사용성, 성능과 보안을 대폭 개선해줍니다. 주된 차별점은 다음과 같습니다.

  1. DBIO로 성능 개선: Databricks I/O 모듈, 즉 DBIO는 수직으로 통합된 스택을 활용해 클라우드 내 Spark의 성능을 대폭 개선합니다.
  2. DBES로 보안 강화: Databricks Enterprise Security, 즉 DBES 모듈은 미사용 데이터나 동작 중인 데이터에 데이터 암호화와 같은 기능을 제공하고 세분화된 데이터 액세스 제어 및 감사를 통해 안전 규정 준수 기준을 충족하며(예: HIPAA, SOC2) 대기업이라면 당연히 예상할 만한 극히 엄격한 보안 요구사항에도 부합합니다. HIPAA, SOC2) 대기업이라면 당연히 예상할 만한 극히 엄격한 보안 요구사항에도 부합합니다.
  3. 운영 복잡성 대폭 완화: 컴퓨팅 리소스와 로컬 스토리지 자동 확장(오토스케일링)과 같은 기능을 통해 Spark를 "오토파일럿" 모드에 놓아 운영 복잡성과 관리 비용을 눈에 띄게 줄였습니다.
  4. 신속한 릴리스와 신기능 조기 액세스: Databricks의 SaaS 제품은 업스트림 오픈 소스 릴리스에 비해 빠른 릴리스 주기를 촉진하여 고객이 오픈 소스 릴리스에서는 아직 이용할 수 없는 최신 기능과 버그 수정을 접할 수 있습니다.

Databricks Runtime

 

Databricks Runtime 관련 FAQ

Databricks Runtime은 오픈 소스 Apache Spark와 어떻게 다르나요?
Databricks Runtime에는 기본 Spark 엔진 외에도 Databricks I/O(DBIO) 모듈, Enterprise Security(DBES), 오토스케일링 등 다양한 최적화 기능이 포함되어 있습니다. 이를 통해 데이터 처리 속도, 안정성, 보안성 측면에서 일반 오픈 소스 Spark보다 우수한 성능을 제공합니다.

Databricks Runtime의 주요 성능 향상 요인은 무엇인가요?
Databricks I/O(DBIO)는 수직 통합 스택을 활용해 클라우드 스토리지와 Spark 간의 I/O 성능을 최적화합니다. 결과적으로 쿼리 처리 속도 향상, 지연 시간 단축, 비용 절감이 가능합니다. 또한 자동 리소스 확장 기능으로 워크로드에 맞춰 성능이 동적으로 조정됩니다.

기업 환경에서 Databricks Runtime을 사용하는 주된 이점은 무엇인가요?
Databricks Runtime은 Enterprise Security(DBES)를 통해 데이터 암호화, 세분화된 접근 제어, 감사 로깅 등 기업 보안 요구사항을 충족합니다. 또한 자동 업데이트, 버그 수정, 빠른 신기능 제공으로 기업의 운영 복잡성을 줄이고 최신 기술을 안정적으로 활용할 수 있습니다.

추가 자료

용어집으로 돌아가기