Databricks의 핵심 구성 요소는 데이터 사이언스 워크스페이스이며, 데이터팀에 있는 모든 사람이 협업할 수 있도록 지원합니다. 협업형 노트북 환경은 데이터 사이언티스트, 데이터 애널리스트, 데이터 엔지니어 등, 데이터팀에 있는 모든 사람이 사용합니다. Databricks는 다양한 산업에서 이와 마찬가지로 폭넓은 사용 사례에 사용됩니다. 이 갤러리에서는 자신의 Databricks 환경으로 쉽게 가져올 수 있는 노트북이나 무료 커뮤니티 에디션(CE)이 제공하는 몇 가지 대표적인 예시를 담았습니다.
Delta Lake
데이터 레이크하우스를 구축하고 ACID 트랜잭션, 시간 이동, 제약 조건 등을 오픈 파일 형식으로 가져오기
Databricks: 7.6.x – 비 CE
Delta Lake 자세히 보기
ACID 트랜잭션을 Apache Spark™로 가져오는 오픈 소스 스토리지 형식인 Delta Lake에 대한 자세한 설명입니다.
머신 러닝
TensorFlow, Spark MLlib, Horovod 등의 인기 머신 러닝 프레임워크 지원
Databricks: 7.6.x w/GPU – 비 CE
PyTorch 및 Horovod를 사용한 분산형 딥 러닝
PyTorch에서 Horovod를 사용하여 분산된 모델 훈련을 실행하는 방법을 알아보세요.
Databricks: 7.6.x w/GPU – 비 CE
Spark에서 TensorFlow까지: 데이터 전환 단순화
Spark DataFrames의 데이터를 간단하게 전환하여 TensorFlow에서 사용할 수 있습니다.
MLflow
머신 러닝에 대한 종단 간 지원: 모델 훈련부터 프로덕션 배포까지
Apache Spark™
데이터 레이크하우스에서 데이터 엔지니어링과 데이터 사이언스를 지원하는 분산형 컴퓨팅 엔진
Databricks: 8.0.x – 비 CE
사용자 정의 함수(UDF)로 SparkR 확장
R에서 UDF를 사용하여 맞춤 함수를 작성하고 SparkR의 기능을 확장하는 방법을 알아보세요.