주요 컨텐츠로 이동

SQL 서버에서 Databricks로의 마이그레이션 탐색: 원활한 전환을 위한 팁

Lakehouse 아키텍처로 전환하기 위한 전략, 도구, 그리고 모범 사례

migrating to SQL Server OG

Published: May 5, 2025

솔루션1분 이내 소요

Summary

  • 복잡한 T-SQL 로직을 분산 Spark SQL로 90% 자동화하여 변환하는 방법을 알아보세요.
  • CDC 복제 및 병렬 검증 프레임워크를 사용하여 제로 다운타임 마이그레이션을 구현하십시오.
  • Databricks 워크플로우에서 페타바이트 규모의 처리를 위해 레거시 SSIS 패키지를 최적화합니다.

현대화의 필요성

SQL 서버와 같은 전통적인 데이터베이스 솔루션은 AI/ML, 스트리밍 기능 지원 부족 및 높은 비용 때문에 현대 데이터 작업 부하에 대응하는 데 어려움을 겪었습니다. 기업들은 점점 더 클라우드 네이티브 솔루션인 Databricks를 채택하여 유연성, 확장성, 비용 효율성을 향상시키고 고급 분석 사용 사례를 가능하게 합니다.

Databricks가 SQL Server보다 가지는 주요 이점

  • 통합 플랫폼: 구조화된 데이터와 비구조화된 데이터 처리를 AI/ML 기능과 결합합니다. 또한, Unity 카탈로그는 모든 데이터 자산에 대한 종합적인 데이터 거버넌스를 제공합니다.
  • 확장성: Databricks는 클라우드 기반 인프라를 통해 작업 부하 요구에 따라 자원을 탄력적으로 확장할 수 있습니다. 이 아키텍처는 개선된 쿼리 성능과 감소된 지연 시간으로 크고 복잡한 작업 부하를 처리할 수 있게 합니다.
  • 비용 효율성: 사용량에 따라 비용을 지불하는 클라우드 가격 모델은 인프라 하드웨어 비용을 줄입니다. 관리 비용의 감소와 자원 활용의 향상은 전체 TCO를 크게 줄입니다.
  • 고급 분석: Databricks는 AI/ML, GenAI, 실시간 스트리밍과 같은 고급 분석 사용 사례를 위한 내장 기능을 제공합니다. 더불어, Databricks SQL을 사용하면 사용자들이 자신들이 선호하는 BI 도구를 통합할 수 있어, 복잡한 분석을 더 효율적으로 수행할 수 있습니다.

아키텍처 깊이 파헤치기

SQL Server에서 Databricks로 이전하는 것은 Lakehouse 모델의 장점을 활용하여 데이터 아키텍처를 재고하는 것을 포함합니다. 두 플랫폼 간의 주요 차이점을 이해하는 것은 효과적인 마이그레이션 전략을 설계하는 데 중요합니다. SQL Server와 Databricks의 주요 차이점: 

기능

SQL Server

databricks

아키텍처

단일 구조 RDBMS

오픈 레이크하우스

확장성

수직 스케일링

클러스터를 통한 수평적 확장

AI/ML 지원

최소화된

AI/ML에 대한 내장 지원

실시간 스트리밍

제한적

완전히 지원됨

Databricks에서의 현대 데이터 웨어하우징
Modern data warehousing on Databricks

 

기업 데이터 마이그레이션

온-프레미스 SQL Server에서 클라우드 기반 Databricks로 데이터를 마이그레이션하려면 작업량 크기와 복잡성에 따라 적절한 도구와 전략을 선택해야 합니다.

데이터 마이그레이션을 위한 권장 접근 방식: 

  1. Databricks Lakeflow Connect: Lakeflow Connect는 SQL Server에서 Databricks lakehouse로의 원활한 데이터 수집을 위한 완전 관리형 SQL Server 커넥터를 제공합니다. 자세한 정보는 SQL Server에서 데이터 수집을 참조하십시오.
  2. Databricks 레이크하우스 연합 활용: Databricks 레이크하우스 연합은 SQL 서버를 포함한 다양한 데이터 소스에 걸쳐 연합 쿼리를 가능하게 합니다.
  3. ISV 파트너: Qlik 및 Fivetran과 같은 Databricks ISV 파트너는 SQL 서버에서 Databricks 델타 테이블로 데이터를 복제할 수 있습니다.

코드 이주

T-SQL에서 Databricks SQL로의 마이그레이션은 SQL 스크립트, 저장 프로시저, 그리고 ETL 워크플로우를 Databricks 호환 형식으로 리팩토링하면서 성능을 최적화하는 것을 필요로 합니다. Databricks는 이 과정을 더욱 원활하고 고도로 자동화하게 하는 성숙한 코드 변환기와 이전 도구를 갖추고 있습니다.

bladebridge 통합

BladeBridge에서 인수한 Databricks Code Converter는 로직을 Databricks SQL 또는 PySpark 노트북으로 자동 변환할 수 있습니다. BladeBridge 변환 도구는 스키마 변환(테이블 및 뷰) 및 SQL 쿼리(select 문, 표현식, 함수, 사용자 정의 함수 등)를 지원합니다. 또한, 저장된 프로시저는 모듈식 Databricks 워크플로우, SQL 스크립팅, 또는 DLT 파이프라인으로 변환될 수 있습니다. 

ETL 워크플로우 현대화

Databricks는 SSIS 또는 SQL Agent가 전통적으로 관리하는 복잡한 워크플로우를 단순화하는 현대적인 ETL 파이프라인에 대한 다양한 옵션을 제공합니다.

Databricks에서의 ETL 오케스트레이션 옵션:

  1. Databricks 워크플로우: Python 스크립트, 노트북, dbt 변환 등을 지원하는 네이티브 오케스트레이션 도구입니다.
  2. DLT (DLT): 내장된 데이터 품질 검사와 함께 선언적 파이프라인입니다.
워크플로우
Databricks Workflows
dlt
Databricks DLT

 

BI 및 분석 도구 통합

Databricks SQL은 조직이 데이터 웨어하우징 요구 사항을 충족시키고 하위 스트림 애플리케이션 및 BI 대시보드를 지원하도록 합니다. 데이터 파이프라인을 마이그레이션 한 후에는 비즈니스 연속성을 보장하기 위해 Power BI나 Tableau와 같은 BI 도구를 재지정하는 것이 중요합니다.

Microsoft Power BI는 다양한 고객 환경에서 일반적으로 볼 수 있는 하류 애플리케이션으로, 일반적으로 SQL Server의 서비스 계층 위에서 작동합니다.

Power BI 통합 모범 사례

  1. Delta 테이블에서 실시간 분석을 위해 DirectQuery 모드를 사용하세요. DirectQuery는 Databricks와 SQL Server에 비해 2-5배 빠릅니다 .
  2. Databricks SQL 웨어하우스의 materialized views를 활용하여 집계를 통해 더 빠른 대시보드를 제공합니다.
  3. 고동시성, 저지연 작업 부하에 대한 최상의 성능을 위해 SQL Serverless 웨어하우스를 사용하세요.

아래는 비즈니스 요구 사항에 맞게 BI 모델과 의미적 레이어를 최적화하는 데 잘 작동하는 미래의 아키텍처입니다. 이는 대시보드, 애플리케이션, AI, ML 사용 사례를 공급하기 위해 청동, 은, 금 계층을 포함합니다. 

과정

검증 프레임워크

검증은 마이그레이션된 데이터셋이 플랫폼 간에 정확성과 일관성을 유지하도록 보장합니다. 권장 검증 단계:

  1. 소스(Netezza)와 대상(Databricks) 사이의 스키마를 확인합니다.
  2. Remorph Reconcile 또는 DataCompy와같은 자동화 도구를 사용하여 행 수와 집계 값을 비교합니다.
  3. 전환 단계 동안 병렬 파이프라인을 실행하여 쿼리 결과를 검증하십시오

지식 전달 및 조직 준비

Databricks 개념, Delta Lake 아키텍처, Databricks SQL, 성능 최적화에 대한 팀의 업스킬링은 장기적인 성공에 중요합니다. 교육 추천:

  • 분석가들에게 Databricks SQL 웨어하우스 기능에 대해 교육하세요.
  • SSIS에서 DLT 파이프라인으로 전환하는 엔지니어를 위한 실습을 제공하세요.
  • 이전 패턴과 문제 해결 플레이북을 문서화합니다.

예측 가능하고, 위험성이 낮은 마이그레이션

SQL 서버에서 Databricks로의 마이그레이션은 기술뿐만 아니라 데이터 관리와 분석 방식에서도 중요한 변화를 의미합니다. 철저한 계획을 세우고, 플랫폼 간의 주요 차이점을 해결하고, Databricks의 독특한 기능을 활용함으로써, 조직은 향상된 성능, 확장성, 비용 효율성을 제공하는 성공적인 마이그레이션을 달성할 수 있습니다. 

이 마이그레이션 여정은 데이터가 어디에 위치하고 어떻게 작업하는지 현대화하는 기회입니다. 이 팁을 따르고 일반적인 함정을 피함으로써, 귀사는 Databricks 플랫폼으로 원활하게 전환하고 데이터 기반 의사결정을 위한 새로운 가능성을 개방할 수 있습니다. 

이전의 기술적 측면이 중요하긴 하지만, 조직의 준비도, 지식 전달, 채택 전략에 동등한 주의를 기울여야 장기적인 성공을 보장할 수 있다는 것을 기억하세요.

다음에 할 일

이전은 어려울 수 있습니다. 항상 균형을 맞추어야 할 타협점과 예상치 못한 문제와 지연을 관리해야 합니다. 이전의 사람, 프로세스, 기술 측면에 대한 검증된 파트너와 솔루션이 필요합니다. 우리는 Databricks Professional Services 와 우리의 인증된 이전 파트너를 신뢰하는 것을 추천합니다. 이들은 고품질의 이전 솔루션을 적시에 제공하는 데 광범위한 경험을 가지고 있습니다. 연락 하여 이전 평가를 시작하세요.

또한 Azure Databricks로 이동하여 데이터 Estate를 현대화하는 eBook를 확인해 보시기 바랍니다. 

또한, 완벽한 SQL Server에서 Databricks로의 이전 가이드를 가지고 있습니다–여기에서 무료 복사본을 받으세요.  

 

 

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요