주요 컨텐츠로 이동

Mosaic AI

프로덕션 품질의 ML 및 GenAI 애플리케이션 구축 및 배포

Databricks Mosaic AI는 예측 모델 구축부터 최신 GenAI 및 대규모 언어 모델(LLM)에 이르기까지 AI 및 ML 솔루션을 구축, 배포, 모니터링하기 위한 통합 도구를 제공합니다. Databricks Data Intelligence Platform을 기반으로 구축된 Mosaic AI를 통해 조직은 기업 데이터를 AI 수명 주기에 안전하고 비용 효율적으로 통합할 수 있습니다. 

We Put the Company First

완벽한 제어

모델 및 데이터 모두에 대한 소유권 유지

secondary-icon-graphic-10

프로덕션 품질

정확하고 안전하며 제어 가능한 AI 애플리케이션 제공

Value Action

비용 절감

10배 더 저렴한 비용으로 맞춤형 LLM 트레이닝 및 제공

Start building your generative AI solution

생성형 AI 솔루션 구축 시작

대규모 언어 모델 기반 솔루션을 구축할 때는 프롬프트 엔지니어링, 검색 증강 생성(RAG), 미세 조정, 사전 트레이닝 등 4가지 아키텍처 패턴을 고려해야 합니다. Databricks는 4가지 생성형 AI 아키텍처 패턴을 모두 지원하는 유일한 공급업체로, 가장 많은 옵션을 제공하고 비즈니스 요구 사항에 맞춰 발전시킬 수 있습니다.

Complete ownership over your models and data

모델 및 데이터에 대한 완전한 소유권

Mosaic AI는 데이터, 모델 트레이닝, 프로덕션 환경을 단일 솔루션으로 통합하는 Databricks Data Intelligence Platform에 포함되어 있습니다. 엔터프라이즈 데이터를 안전하게 사용하여 자체 머신 러닝과 생성형 AI 모델을 보강, 미세 조정 또는 구축할 수 있으므로, 데이터와 AI를 외부로 전송하지 않고도 비즈니스에 대한 의미론적 이해를 바탕으로 모델의 성능을 강화할 수 있습니다.

Deploy and govern all your AI models centrally

모든 AI 모델을 중앙에서 배포 및 관리

Model Serving은 AI 모델을 배포, 관리, 쿼리하기 위한 통합 서비스입니다. Databricks의 통합 접근 방식을 사용하면 모델을 간편하게 Experiment하고 프로덕션화할 수 있습니다. 여기에는 다음이 포함됩니다.

  • 맞춤형 ML 모델(예: PyFunc, scikit-learn, LangChain)
  • Databricks 기반 파운데이션 모델(FM)(예: Llama 2, MPT, Mistral, BGE)
  • 다른 곳에서 호스팅되는 파운데이션 모델(예: ChatGPT, Claude 2, Cohere, Stable Diffusion)

Monitor data, features and AI models

한 곳에서 데이터, 기능 및 AI 모델 모니터링

Lakehouse Monitoring은 Databricks Data Intelligence Platform 내에서 단일 통합 모니터링 솔루션을 제공하고, 클릭 한 번으로 모든 테이블의 통계적 속성과 품질을 모니터링합니다. 생성형 AI를 기반으로 하는 애플리케이션의 경우 결과물에서 유해한 콘텐츠를 스캔하고 오류를 진단할 수 있습니다.

Govern and track lineage across the full AI lifecycle

데이터부터 모델까지 전체 AI 수명 주기의 리니지 관리 및 추적

적절한 권한을 적용하고, 비율 제한을 설정하며, 리니지를 추적하여 엄격한 보안 및 거버넌스 요구 사항을 충족합니다. 데이터부터 모델까지 모든 ML 자산을 단일 도구인 Unity Catalog로 관리하여 개발부터 배포, 유지 관리에 이르는 ML 수명 주기의 전 단계를 일관되게 감독하고 제어합니다.

Train and serve your own custom LLMs at 10x lower cost

10배 더 저렴한 비용으로 맞춤형 LLM 트레이닝 및 제공

Mosaic AI를 사용하면 처음부터 맞춤형 대규모 언어 모델을 구축하여 모델의 기반 지식을 특정 도메인에 맞게 조정할 수 있습니다. 조직의 IP와 데이터를 바탕으로 학습하면 고유하게 차별화된 맞춤형 모델이 생성됩니다. Databricks Mosaic AI Training은 최대 10배 더 낮은 학습 비용으로 며칠 만에 수십억 매개변수 LLM을 새롭게 구축할 수 있는 최적화된 트레이닝 솔루션입니다.

제품 구성요소

협업 노트북

Databricks 노트북은 기본적으로 Python, R, SQL과 Scala를 지원하기 때문에 실무자가 직접 선택한 언어와 라이브러리를 활용하여 인사이트를 검색, 시각화하고 공유할 수 있습니다.

자세히

Runtime for Machine Learning

가장 보편적인 ML 프레임워크(예를 들어 PyTorch, TensorFlow와 scikit-learn 등)의 확장 가능하고 안정적인 배포로 지원하여 미리 구성한 ML 최적화 클러스터에 원클릭 액세스를 제공하며, 비할 데 없는 최고의 대규모 성능에 기본 내장된 최적화를 보장합니다.

자세히

Feature Store

자동으로 로깅된 데이터 소스를 활용하는 데이터 리니지 기반 feature 검색으로 feature 재사용을 가능하게 합니다. 클라이언트 어플리케이션을 변경하지 않아도 되는 단순화된 모델 배포 및 트레이닝에 feature들이 활용되도록 해보세요.

자세히

AutoML

ML 전문가부터 일반인 데이터 사이언티스트에 이르기까지 누구에게나 "글래스 박스(glass box)" 방식으로 AutoML을 접할 수 있게 권한을 부여하면 최고 성능의 모델을 확보할 수 있을 뿐만 아니라, 전문가가 추가로 조정할 수 있는 코드도 작성됩니다.

자세히

관리형 MLFlow

ML 수명 주기용 오픈소스 플랫폼 중 단연 세계적으로 대표적인 MLflow를 기반으로 구축한 관리형 MLflow를 이용하면 ML 모델을 실험부터 프로덕션까지 단계를 빨리 진행하는 데 유리하며, 그 과정에서 엔터프라이즈급 보안, 안정성과 확장성을 보장합니다.

자세히

프로덕션급 모델 제공

클릭 한 번으로 간단하게 모든 규모의 모델을 활용할 수 있으며, 서버리스 컴퓨팅을 활용할 수 있는 옵션도 제공됩니다.

자세히

모델 모니터링

모델 성능 및 비즈니스 지표에 미치는 실시간 효과를 실시간으로 모니터링합니다. Databricks는 프로덕션의 모델에서 소스 데이터 시스템에 이르기까지 전체적인 가시성과 리니지를 제공하기 때문에, 전체 ML 수명 주기에서 모델과 데이터 품질을 분석하는 데 도움을 받고 문제가 심각해지기 전에 미리 발견할 수 있습니다.

자세히

리포지토리

Repos는 엔지니어가 Databricks의 Git 워크플로를 따를 수 있으며, 데이터 팀에서도 자동 CI/CD 워크플로와 코드 이식성을 활용할 수 있습니다.

자세히

대규모 언어 모델

Databricks를 사용하면 LLM에 대한 액세스를 간단하게 배포, 관리, 쿼리 및 모니터링하고 이를 워크플로에 통합할 수 있으며, 자체 데이터를 사용하여 LLM을 강화(RAG)하거나 미세 조정하기 위한 플랫폼 기능을 제공하여 도메인 성능을 향상할 수 있습니다. 또한 Databricks는 10배 더 저렴한 비용으로 며칠 만에 LLM을 사전 트레이닝할 수 있는 최적화된 도구를 제공합니다.

자세히