基盤モデルサービング

リアルタイムおよびバッチ推論ワークロードのニーズに対応する、最先端のオープン基盤モデルを提供します。これにより、独自のモデル展開を維持することなく、高品質な生成 AI モデルを活用したアプリケーションを迅速かつ容易に構築できます。

* 表示されている価格は、そのリージョンでの製品の提供を保証するものではありません。製品の提供状況については、こちらをご覧ください: AWS, Azure, GCP, SAP
1. Azure Databricks は Microsoft Azure のファーストパーティサービスとして、Microsoft による一元的な請求とサポートを提供します
Azure Databricks の Premium ティアは、AWS および GCP の Enterprise ティアに相当します
2. 時間単位の料金は、分単位で課金されます
3. 単一ユニットの PT 容量の throughput は、モデルとクエリーの形式 (入力トークンと出力トークン) によって異なります。ワークロード固有のthroughputと総費用の見積もりには、GenAI Calculator をご利用ください。

基盤モデルサービングのDBU料金

モデル	トークン単位の従量課金		プロビジョニング済みスループット
モデル	DBU / 100万入力トークン	DBU / 100万出力トークン	DBU / 時間（エントリー容量）	DBU / 時間 (スケーリング容量)
Llama 4 Maverick	7.143	21.429	85.714	85.714
Llama 3.3 70B	7.143	21.429	85.714	342.857
Qwen 3 Next 80B	2.143	17.143	78.571	78.571
Qwen 3.5 122B	3.143	31.429	85.714	85.714
GPT OSS 120B	2.143	8.571	71.429	71.429
Gemma 3 12B	2.143	7.143	71.429	71.429
Llama 3.1 8B	2.143	6.429	53.571	106.000
GPT OSS 20B	1.000	4.286	53.571	53.571
Llama 3.2 3B	N/A	N/A	46.429	92.857
Llama 3.2 1B	N/A	N/A	42.857	85.714
Qwen 3 0.6B エンベディング	0.286	N/A	25.000	25.000
GTE	1.857	N/A	20.000	20.000
BGE Large	1.429	N/A	24.000	24.000

¹: エントリーキャパシティは、顧客がより手頃な価格で始められるように設計された、小規模で低コストの PT キャパシティユニットです。これらはスケーリング容量と比較して、throughputが比例的に低下します。これらは、Azure および AWS の米国、カナダ、ブラジルのリージョンで、ベースモデル（ファインチューニングされていないモデル）にのみご利用いただけます。

²: スケーリングキャパシティとは、モデルにプロビジョニングできる、標準の PT キャパシティ増分のことです。エントリ容量（一部のクラウドとリージョンで利用可能）を超えると、プロビジョニングされたThroughput容量は、これらのスケーリング容量ユニット単位でスケールアップおよびスケールダウンします。エントリ容量が利用できないクラウド / リージョンでは、PT の最小購入単位は、スケーリング容量ユニット 1 つ分となります。

従量課金制のプランを 14 日間無料でお試しいただけます。コミットに応じた割引価格および、カスタム要件もご用意しております。

無料トライアルご相談・お問い合わせ