주요 컨텐츠로 이동

자체 LLM 및 기타 생성형 AI 모델 트레이닝

Databricks에서 대규모 언어 모델을 사용하여 혁신 가속화

Mosaic AI Training을 통해 기업 데이터로 트레이닝한 맞춤형 LLM을 구축하세요. 맞춤형 모델은 비즈니스 상황 및 도메인에 맞게 차별화되고 맞춤화되어 생성형 AI 애플리케이션의 품질을 향상시킵니다.

mosaic ai training image
S&P Global image

효율성 및 편의성

대규모 언어 모델을 트레이닝하는 것은 대개 복잡하고 어려우며 광범위한 전문 지식이 필요합니다. 그러나 Mosaic AI Training에서는 누구나 데이터 소스를 지정하기만 하면 맞춤형 LLM을 쉽고 효율적으로 학습할 수 있습니다. 수백 개의 GPU로 확장, 모니터링, 자동 복구 등 나머지 작업은 Mosaic AI Training에서 처리합니다. 수십억 개의 매개변수가 포함된 LLM 학습을 몇 주가 아닌 며칠 만에 완료할 수 있습니다.

Using LLM image

높은 비용 효율성

Mosaic AI Training은 LLM 교육의 비용 효율성을 높이는 최적화된 소프트웨어 스택입니다. 시스템 수준 최적화, 조정된 병렬 전략, 모델 트레이닝 사이언스의 조합을 통해 LLM 트레이닝 비용을 최대 10배까지 낮추는 성과를 실현했습니다.

llama

손쉬운 확장

고성능 LLM 트레이닝의 핵심 요소는 확장성이며, 이를 위해서는 빠르고 레이턴시가 짧은 네트워킹과 고성능 GPU에 대한 액세스가 필요합니다. Mosaic AI Training을 사용하면 NVIDIA InfiniBand 네트워킹과 최고의 NVIDIA GPU인 NVIDIA H100 Tensor Core GPU에 모두 자동으로 액세스할 수 있는데, 이는 이전 하드웨어 세대보다 탁월한 성능과 확장성을 제공합니다. 이를 통해 대규모 모델(700억 개 이상의 매개변수)을 손쉽게 트레이닝할 수 있도록 확장하고 몇 시간 또는 며칠 내에 트레이닝을 완료할 수 있습니다.

fine tuning

보안 및 규정 준수

대부분의 조직에서 보안은 가장 중요하며 직원들이 조직의 데이터를 타사 API로 보내 데이터를 유출하거나 공개 모델을 훈련하는 데 사용하는 위험을 감수할 여력이 없습니다. Mosaic AI Training에서는 조직이 자체 LLM을 구축하여 데이터 및 모델에 대한 완벽한 제어력과 소유권을 유지하기 때문에 이러한 문제를 걱정할 필요가 없습니다. 트래픽과 모든 트레이닝 데이터를 포함하여 모든 것이 기본적으로 암호화된 상태로 유지되므로 데이터 개인정보 보호와 모델 소유권을 완벽하게 보호하여 모든 규제를 준수할 수 있습니다.

시작할 준비가 되셨나요?