작성자: 리디마 굽타, 휴버트 주브, 프리트비 칸난, 아푸르바 코티, Sunish Sheth , Corey Zumar
MLflow는 모델 개발 및 실험을 위한 최고의 플랫폼입니다. 수천 개의 데이터 사이언티스트가
매일 MLflow Experiment Tracking을 사용하여 parameter, 성능 메트릭 및 원본 정보를
기반으로 모델을 보고, 필터링하고, 정렬할 수 있는 강력한 GUI 기반 환경을 통해 최상의
후보 모델을 찾습니다.
오늘 시각적 모델 성능 인사이트를 제공하는 구성 가능한 차트 보기, 튜닝을 위한 개선된
병렬 좌표 환경, 검색 및 필터링 기능이 향상된 간소화된 테이블 보기를 포함하여
MLflow Experiment UI에 대한 몇 가지 주요 개선 사항을 발표하게 되어 기쁩니다.
이러한 개선 사항을 통해 데이터 사이언티스트의 모델 비교 속도가 크게 향상되고
가장 좋아하는 일인 멋진 모델 구축에 더 많은 시간을 할애할 수 있을 것으로 기대합니다.
새로운 MLflow Experiment UI의 몇 가지 주요 개선 사항 및 기능을 살펴보겠습니다.
새 차트 보기로 모델 성능 분석
프로덕션에 가장 적합한 모델을 식별하기 위 해 데이터 사이언티스트는 모델의 parameter 및
성능 메트릭의 시각화에 크게 의존합니다. 예를 들어, 꺾은선형 차트는 정확도가 향상되고
있는지 확인하기 위해 훈련 중 모델의 진행 상황을 보여주고, 막대 차트는 여러 모델 간의
성능 차이에 대한 빠른 통찰력을 제공합니다.
MLflow Experiment 페이지에 새로운 차트 보기를 도입하게 되어 기쁩니다.
차트 보기는 모든 모델의 parameter 및 메트릭에 대한 막대, 선, 분산형 및 평행 좌표 플롯을 지원하는 사용자 지정 가능한 모델 성능 대시보드입니다. 실행을 선택하고 "비교"를 누를 필요 없이 이제 테이블과 차트 보기 간에 원활하게 전환하고 원하는 실행 비교 모드를 선택할 수 있습니다. 각 차트는 구성 가능하고 대화형이므로 표시할 축과 데이터를 선택하고, 데이터 포인트를 필터링하여 가장 관련성이 높은 결과를 찾고, 나중에 참조할 수 있도록 최상의 모델을 pin 수 있습니다. 차트 보기는 모델 개발 경험과 속도를 크게 향상시켜 수동 플로팅 및 계산의 필요성을 줄여줍니다.
개선된 평행 좌표 차트로 모델을 더 빠르게 튜닝
고품질 모델을 개발하기 위해 데이터 사이언티스트는 모델 parameter신중하게 선택해야 합니다. 이 하이 퍼파라미터 튜닝 프로세스에서는 가장 중요한 것을 식별하기 위해 수십, 수백 또는 수천 개의 parameter 탐색해야 하는 경우가 많습니다. 이 프로세스 전반에 걸쳐 병렬 좌표 차트는 모델 parameter 와 성능 메트릭 간의 관계와 다양한 parameter 값이 주어진 메트릭에 영향을 미칠 수 있는 방식을 시각화하는 데 매우 유용한 도구입니다.
새로운 차트 보기에 병렬 좌표 차트가 포함되어 수천 개의 모델 학습 실행에서 parameter 조합을
동시에 원활하게 분석할 수 있습니다. 또한 병렬 좌표 차트는 고급 시각화 프레임워크를 사용하여
재구축되어 확장성이 뛰어난 대화형 환경을 제공합니다. 새로운 기능은 다음과 같습니다.
개선된 평행 좌표 차트를 사용하면 모델을 훨씬 쉽게 조정할 수 있으므로 고품질 모델을 빠르게
빌드하고 배송할 수 있습니다.
간소화된 테이블 보기 및 검색 환경을 갖춘 최상의 모델 찾기
모델 개발은 반복적인 프로세스입니다. 데 이터 사이언티스트는 프로덕션에 가장 적합한 모델을
선택하기 전에 수천 개의 후보 모델을 탐색하는 경우가 많습니다. 새로운 데이터가 수집되고
애플리케이션 요구 사항이 변경되면 모델이 계속해서 정확한 예측을 할 수 있도록 다시 학습됩니다. 따라서 데이터 사이언티스트는 모델 학습 결과를 검색 및 필터링할 수 있어야 할 뿐만 아니라 학습이 진행됨에 따라 최상의 모델을 추적할 수 있어야 합니다. 새 MLflow Experiment UI에는 이 환경을 간소화하기 위한 몇 가지 기능과 개선 사항이 포함되어 있습니다.
이제 만드는 모든 MLflow 실행에는 모델을 식별하고 비교하는 데 도움이 되는 기억하기 쉬운
이름이 있습니다. 또한 이제 실행 테이블의 맨 위에 실행을 pin 수 있습니다. pin 실행은 모델
학습 결과를 계속 필터링하고 탐색하는 동안 항상 표시되므로 이제 빠른 비교를 위해 "기준"
모델을 pin 할 수 있습니다. 마지막으로, Databricks AutoML 또는 MLflow 레시피를
사용하여 모델을 학습하는 경우 Experiment 페이지에 가장 관련성이 높은 성능 메트릭 및
모델 특성이 자동으로 표시되므로 최적의 모델을 빠르게 식별할 수 있습니다.
열 선택기 드롭다운을 사용하여 추가 모델 정보를 쉽게 표시할 수 있습니다.
또한 자동 제안 기능을 통합하여 Experiment 경험의 검색 환경을 크게 간소화했습니다.
검색 창에 성능 지표 또는 모델 parameter 의 이름을 입력하기만 하면 자동 제안 드롭다운에
query사용 방법이 표시됩니다. Experiment 페이지에는 구문을 빠르게 익히는 데
도움이 되는 포괄적인 예제 검색 query 목록도 포함되어 있습니다.
새 MLflow Experiment UI 시작
새롭게 향상된 MLflow Experiment UI를 사용하면 고품질 모델을 대규모로 개발하고
프로덕션에 가장 적합한 모델을 손쉽게 식별할 수 있습니다. 새로운 환경은 이미 많은
Databricks 워크스페이스에 출시되었으며 곧 모든 곳에서 사용할 수 있습니다.
워크스페이스 사이드바에서Experiment 로 이동하여 Experiment 선택하기만 하면
시작할 수 있습니다. 새로운 MLflow Experiment UI가 제공하는 모든 것을 탐색하고
피드백을 기다리는 것이 좋습니다.
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.