Azure Data Factory 고객들은 이제 새로운 기본 Databricks Job 활동을 사용하여 Databricks 워크플로우를 트리거할 수 있으며, 이를 통해 두 플랫폼 간의 더 깊은 통합을 가능하게 합니다. 이 모범 사례는 고객들이 Databricks 데이터 인텔리전스 플랫폼을 완전히 활용하도록 돕습니다, 이에는 Databricks SQL, DLT, 그리고 Power BI 발행과 같은 고급 기능이 포함됩니다. 노트북 활동에서 워크플로우로 이전함으로써, 고객들은 성능을 향상시키고, 비용을 줄이며, 데이터 및 AI 파이프라인 전반에 걸쳐 작업을 단순화할 수 있습니다.
Azure 데이터브릭스는 첫 번째 파티 Microsoft 서비스로, Azure 생태계와 기본적으로 통합되어 데이터와 AI를 고성능 분석 및 깊은 도구 지원과 통합합니다. 이 밀접한 통합은 이제 Azure Data Factory (ADF)에서 네이티브 Databricks Job 활동을 포함하여, ADF 내에서 직접 데이터브릭스 워크플로우를 트리거하는 것이 어느 때보다 쉬워졌습니다.
이 새로운 ADF 활동은 즉각적인 모범 사례이며, 모든 ADF 및 Azure 데이터브릭스 사용자들은 이 패턴으로 전환을 고려해야 합니다.
새로운 Databricks Job 활 동은 매우 간단하게 사용할 수 있습니다:

3. 설정 탭에서, Job 드롭 다운 목록에서 실행할 데이터브릭스 워크플로우를 선택합니다 (인증된 주체가 접근할 수 있는 Job만 보게 됩니다). 아래의 Job Parameters 섹션에서, 데이터브릭스 워크플로우로 보낼 Job Parameters (있는 경우)를 설정합니다. Databricks Job Parameters에 대해 더 알고 싶다면, 문서를 확인하세요.

그게 전부입니다. ADF는 Databricks 워크플로우를 시작하고 Job Run ID와 URL을 반환합니다. ADF는 Job Run이 완료될 때까지 폴링합니다. 아래에서 이 새로운 패턴이 왜 즉시 클래식이 되었는지 알아보세요.

Azure Data Factory와 Azure Databricks를 함께 사용하는 것은 2018년에 이 블로그 포스트와 함께 출시되었을 때부터 GA 패턴이었습니다. 그 이후로, 이 통합은 주로 이 간단한 패턴을 따르는 Azure 고객들에게 필수적이었습니다:
이 방식은 시간이 지나면서 매우 유용하게 사용되어 왔지만, 고객들이 다음과 같은 운영 방식에 제한되도록 만들었고, 이는 데이터브릭의 진정한 가치를 충분히 활용하지 못하게 하는 결과를 낳았습니다:
이 패턴은 확장 가능하며 Azure Data Factory와 Azure Databricks에 기본적으로 탑재되어 있지만, 2018년 출시 이후로 데이터브릭스가 모든 클라우드에서 시장 선도적인 데이터 인텔리전스 플랫폼으로 크게 성장함에도 불구하고 제공하는 도구와 기능은 동일하게 유지되었습니다.
Azure Databricks는 전통적인 분석을 넘어서 Azure에서 통합 데이터 인텔리전스 플랫폼을 제공합니다. 이것은 업계 선도적인 Lakehouse 아키텍처와 내장된 AI 및 고 급 거버넌스를 결합하여, 고객들이 더 빠르고, 더 낮은 비용으로, 그리고 엔터프라이즈 등급의 보안으로 인사이트를 얻을 수 있도록 돕습니다. 주요 기능은 다음과 같습니다:
Azure Data Factory에서 기본 Databricks Job 활동이 출시되면서 고객들은 이제 데이터브릭스 워크플로우를 실행하고 Jobs Runs에 매개변수를 전달할 수 있습니다. 이 새로운 패턴은 위에서 언급한 제약 사항을 해결할 뿐만 아니라, 이전에는 ADF에서는 사용할 수 없었던 다음과 같은 Databricks 고유 기능들도 활용할 수 있게 해줍니다:아니었습니다.
가장 중요한 것은, 고객들이 이제 ADF Databricks 작업 활동을 사용하여 데이터브릭스 워크플로우의 Power BI 작업을 활용할 수 있습니다, 이는 Unity 카탈로그의 스키마에서 Power BI 서비스에 Semantic Models을 자동으로 게시하고 Import 또는 Dual(설정 지침 문서)를 사용하는 테이블이 있으면 Import를 트리거합니다. 데이터브릭스 워크플로우의 Power BI 작업에 대한 데모는 여기에서 찾을 수 있습니다. 이를 보완하여, Power BI on Databricks 모범 사례 치트시트도 함께 참고해보세요. 이 간결하고 실용적인 가이드는 팀이 보고서의 성능, 비용 효율성, 사용자 경험을 처음부터 최적화할 수 있도록 구성 및 설정 방법을 안내합니다.


ADF의 Databricks 작업 활동은 새로운 최적의 실천 방법입니다
Azure Data Factory에서 Databricks Job 활동을 사용하여 데이터브릭스 워크플로우를 시작하는 것은 두 도구를 사용할 때 새로운 최선의 통합 방법입니다. 고객들은 이 패턴을 즉시 사용하여 데이터브릭스 데이터 인텔리전스 플랫폼의 모든 기능을 활용할 수 있습니다. ADF를 사용하는 고객들은 ADF Databricks Job 활동을 사용하면 즉시 비즈니스 가치와 비용 절감을 얻을 수 있습니다. 노트북 활동을 사용하는 ETL 프레임워크를 가진 고객들은 그들의 프레임워크를 데이터브릭스 워크플로우와 새로운 ADF Databricks Job 활동으로 이전하고 이 이니셔티브를 그들의 로드맵에서 우선 순위로 두어야 합니다.
Azure Databricks의 무료 14일 체험판 을 시작하세요.
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
