eBook

Google Cloud 기반 Databricks를 사용한 데이터 엔지니어링, 데이터 사이언스 및 분석

데이터 엔지니어링 및 데이터 사이언스 사용 사례(코드 샘플 및 노트북 포함)

이 eBook에서는 Google Cloud 기반 Databricks의 개념을 익히기 위해 지금 바로 적용할 수 있는 두 가지 실용적인 데이터 엔지니어링 및 데이터 사이언스 사용 사례를 살펴봅니다. 여기에는 실습을 위한 코드 샘플과 예제 노트북이 포함되어 있습니다.

다음 사용 사례에 대해 자세히 알아봅니다.

  • Google Cloud Storage에서 Delta Lake를 사용하여 데이터 파이프라인을 구축하고 Databricks 및 BigQuery에서 데이터를 가져와 Looker에서 시각화하는 방법
  • Managed MLflow를 사용하여 Experiment 추적을 자동화하고, MLflow Model Registry 사용하여 MLflow 모델의 버전을 관리하고, BigQuery에 추론을 작성하는 방법