대부분의 데이터 과학 솔루션은 데이터 팀이 탐색을 위한 유연성과 프로덕션을 위한 경직성 사이에서 선택하도록 합니다. 그 결과, 데이터 사이언티스트는 종종 다른 기술 스택을 사용하는 엔지니어링 팀에 작업을 전달하고 본질적으로 새로운 환경에서 작업을 다시 작성해야 합니다. 이는 비용이 많이 들 뿐만 아니라 데이터 사이언티스트의 작업이 비즈니스에 가치를 제공하는 데 걸리는 시간을 지연시킵니다.

Databricks의 차세대 데이터 과학 워크스페이스 는 이러한 상충 관계를 해결하여 최신 데이터 팀에 개방적이고 통합된 경험을 제공합니다. 이 Databricks 작업 공간의 일부로, 데이터 팀의 모든 구성원이 모범 사례를 따를 수 있도록 Git 공급자와의 리포지토리 수준 통합을 제공하는 새로운 Repos 기능의 정식 출시를 발표하게 되어 기쁩니다. Databricks Repos는 Github, Bitbucket, Gitlab 및 Microsoft Azure DevOps를 포함한 광범위한 Git 공급자를 지원하여 개발자 툴킷과 통합됩니다.
Git과 통합함으로써 Databricks Repos는 데이터 과학 및 데이터 엔지니어링을 위한 동급 최강의 개발자 환경을 제공합니다. 코드를 프로덕션에 배포하기 전에 Databricks에서 개발된 코드에 대해 코드 검토, 테스트 등의 표준을 적용할 수 있습니다. 개발자는 원격 Git Repos 복제(그림 1), Branch 관리, 원격 변경 사항 풀, commit 전 미처리 변경 사항 시각적 검사(그림 2) 등 Repos에서 익숙한 Git 기능을 사용할 수 있습니다.


Repos의 공개 출시와 함께 가장 까다로운 엔터프라이즈 사용 사례를 충족하는 기능을 추가합니다:
Repos는 CI/CD 파이프라인과 통합될 수도 있으며, 데이터 팀이 Data Science 및 machine learning(ML) 코드를 실험에서 프로덕션까지 원활하게 가져갈 수 있도록 합니다. Repos API(현재 비공개 미리 보기 상태이며, 액세스하려면 Databricks 담당자에게 문의)를 사용하면 프로그래밍 방식으로 Databricks Repos를 원격 브랜치의 최신 버전으로 업데이트할 수 있습니다. 이를 통해 예를 들어 다음과 같은 모범 사례 워크플로 등 CI/CD 파이프라인을 쉽게 구현할 수 있습니다.
Repos 기능은 차세대 워크스페이스 의 일부이며, 이번 공개 릴리스를 통해 데이터 팀은 모범 사례를 쉽게 따르고 탐색에서 프로덕션까지의 경로를 가속화할 수 있습니다.

Repos는 공개 미리 보기 상태이며 Databricks 워크스페이스에서 활성화할 수 있습니다! Repos를 활성화하려면 관리자 패널 -> 고급으로 이동하여 “Repos” 옆에 있는 “활성화” 버튼을 클릭하세요. 개발자 문서에서 더 자세히 알아보세요.
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.