メインコンテンツへジャンプ

モデルトレーニング

独自の LLM ・生成 AI モデルの微調整と事前トレーニング

Mosaic AI モデルトレーニングを使用して、オープンソースの LLM を微調整したり、企業データに基づいてカスタム LLM を構築できます。モデルトレーニングで構築されたカスタムモデルは、より高速で、高品質かつドメイン特化型の結果を生成し、商業用 LLM と比較して最大 10 倍のコスト削減が可能です。

Simplified training with Serverless GPU Compute

Simplified training with Serverless GPU Compute

Databricks offers fast, serverless access to fully managed GPUs—no setup, no idle costs, no quota management. Bring any model, codebase, or framework. Whether you're experimenting with new architectures or running custom pipelines, you get the flexibility and control to move fast.

This native GPU support is the ideal complement to Mosaic AI Model Training—letting you scale custom training and finetuning workflows while keeping your models and data on a single, secure platform.

A complex image with various elements, including text, diagrams, and charts.

高精度

オープンソースの LLM を微調整したり、企業データを使って新しい LLM を構築したりすることは、ビジネスをより意味的に理解することにつながり、精度の高い回答を提供します。Mosaic AI モデルトレーニングは Databricks でネイティブに利用できるため、企業はデータを移動することなく、簡単かつ安全にモデルの微調整や構築を行うことができます。また、ガバナンス、監査可能性、トレーサビリティ、モニタリングも確保し、モデルが正しい方法で使用され、正しいレスポンスを提供していることを確認します。その結果、ビジネスの状況に特化した、より高品質で正確な結果が得られます。

Pretraining compute plane graphic image

容易なスケーリング

高性能 LLM トレーニングの重要な要素はスケーラビリティであり、それには高速で低レイテンシのネットワークと最高性能の GPU へのアクセスが必要です。Mosaic AI Training を使用すると、NVIDIA InfiniBand ネットワーキングとNVIDIA H100 Tensor Core GPU の両方を自動的に利用できるようになります。これにより、大規模なモデル(700 億以上のパラメータ)を容易にトレーニングし、トレーニングの実行を数時間から数日で完了できます。

Pretraining shows it can train a Stable Diffusion model for 10x less cost

費用対効果

Mosaic AI モデルトレーニングは、より小さなオープンソースの生成AI大規模言語モデル(LLM)を微調整して、高効率のモデルを生成することができます。これにより、大きなプロプライエタリ(商業用)LLMと比較して、最大5倍コスト効果の高いモデルを提供できます。さらに、最適化されたソフトウェアスタックを使用して、ゼロから新しいLLMを構築することも可能です。システムレベルの最適化、調整された並列処理戦略、モデルトレーニングの科学の組み合わせにより、トレーニングコストが 10 分の 1 になります。

model training architecture

セキュリティとコンプライアンス

ほとんどの組織にとって、セキュリティは最優先案件であり、従業員がデータをサードパーティの API に送信し、データが流出したり、公開モデルのトレーニングに使用されたりするリスクを負うことは許されません。Mosaic AI モデルトレーニングでは、このような心配は無用です。組織は、独自の LLM を構築し、所有権を保持するため、データとモデルの両方を完全に制御できます。デフォルトでは、トラフィックやすべてのトレーニングデータを含め、全てが暗号化されたままです。これにより、完全なデータプライバシーと完全なモデルオーナーシップが保証され、あらゆる規制コンプライアンスを満たすことができます。

無料お試し・その他ご相談を承ります