독점 파운데이션 모델 서빙
실시간 및 배치 추론 워크로드 요구 사항을 모두 충족하는 최신 오픈 파운데이션 모델을 제공합니다. 이를 통해 다른 공급업체와 별도로 계약하지 않고도 Databricks 플랫폼에서 바로 다양한 공급업체의 고품질 독점 생성형 AI 모델을 활용하는 애플리케이션을 빠르고 쉽게 빌드할 수 있습니다.
Loading...
독점 파운데이션 모델 서빙 DBU 요율
| 모델 | 토큰당 과금 | ||
|---|---|---|---|
| 100만 개의 입력 토큰당 DBU (전역) | 100만 개의 출력 토큰당 DBU (전역) | ||
| OpenAI | |||
| GPT 5 | 글로벌 | 17.857 | 142.857 |
| 지역 내 | 19.643 | 157.143 | |
| GPT 5 Mini | 글로벌 | 3.571 | 28.571 |
| 지역 내 | 3.929 | 31.429 | |
| GPT 5 Nano | 글로벌 | 0.714 | 5.714 |
| 지역 내 | 0.786 | 6.286 | |
| Anthropic | |||
| Claude Opus 4.1 | 글로벌 | 214.286 | 1,071.43 |
| Claude Sonnet 4.5 | 글로벌 | 42.857 | 214.286 |
| 지역 내 | 47.143 | 235.715 | |
| Claude Sonnet 4 | 글로벌 | 42.857 | 214.286 |
| Claude Sonnet 3.7 | 글로벌 | 42.857 | 214.286 |
Proprietary Foundation Model Serving DBU rates
| Model | Endpoint type | Context Length | Pay Per Token | Batch Inference | |||
|---|---|---|---|---|---|---|---|
| Input | Output | Cache writes | Cache reads | ||||
| DBU / 1M Tokens | DBU / 1M Tokens | DBU / 1M Tokens | DBU / 1M Tokens | DBU / hour | |||
| OpenAI | |||||||
| GPT 5.5 | Global | Short | 71.429 | 428.571 | 71.429 | 7.143 | 214.286 |
| In-geo | 78.572 | 471.428 | 78.572 | 7.857 | 235.715 | ||
| GPT 5.4 / 5.5 Pro | Global | Short | 428.571 | 2,571.429 | 428.571 | 42.857 | 1,142.857 |
| In-geo | 471.428 | 2,828.572 | 471.428 | 47.143 | 1,257.143 | ||
| GPT 5.4 / 5.5 Pro | Global | Long | 857.142 | 3,857.144 | 857.142 | 85.714 | 1,142.857 |
| In-geo | 942.856 | 4,242.858 | 942.856 | 94.286 | 1,257.143 | ||
| GPT 5.4 | Global | Short | 35.714 | 214.286 | 35.714 | 3.571 | 192.857 |
| In-geo | 39.285 | 235.715 | 39.285 | 3.929 | 212.143 | ||
| GPT 5.4 | Global | Long | 71.428 | 321.429 | 71.428 | 7.143 | 192.857 |
| In-geo | 78.571 | 353.572 | 78.571 | 7.857 | 212.143 | ||
| GPT 5.4 mini | Global | All Lengths | 10.714 | 64.286 | 10.714 | 1.071 | 107.143 |
| In-geo | 11.786 | 70.714 | 11.786 | 1.179 | 117.857 | ||
| GPT 5.4 nano | Global | All Lengths | 2.857 | 17.857 | 2.857 | 0.286 | 71.429 |
| In-geo | 3.143 | 19.643 | 3.143 | 0.314 | 78.571 | ||
| GPT 5.2/5.3 Codex | Global | All Lengths | 25.000 | 200.000 | 25.000 | 2.500 | n/a |
| In-geo | 27.500 | 220.000 | 27.500 | 2.750 | n/a | ||
| GPT 5.2 | Global | All Lengths | 25.000 | 200.000 | 25.000 | 2.500 | 184.286 |
| In-geo | 27.500 | 220.000 | 27.500 | 2.750 | 202.714 | ||
| GPT 5.1 | Global | All Lengths | 17.857 | 142.857 | 17.857 | 1.786 | 131.429 |
| In-geo | 19.643 | 157.143 | 19.643 | 1.965 | 144.571 | ||
| GPT 5.1 Codex Max | Global | All Lengths | 17.857 | 142.857 | 17.857 | 1.786 | n/a |
| In-geo | 19.643 | 157.143 | 19.643 | 1.965 | n/a | ||
| GPT 5 | Global | All Lengths | 17.857 | 142.857 | 17.857 | 1.786 | 131.429 |
| In-geo | 19.643 | 157.143 | 19.643 | 1.965 | 144.571 | ||
| GPT 5 mini | Global | All Lengths | 3.571 | 28.571 | 3.571 | 0.357 | 71.429 |
| In-geo | 3.929 | 31.429 | 3.929 | 0.393 | 78.571 | ||
| GPT 5.1 Codex Mini | Global | All Lengths | 3.571 | 28.571 | 3.571 | 0.357 | n/a |
| In-geo | 3.929 | 31.429 | 3.929 | 0.393 | n/a | ||
| GPT 5 nano | Global | All Lengths | 0.714 | 5.714 | 0.714 | 0.071 | 53.571 |
| In-geo | 0.786 | 6.286 | 0.786 | 0.078 | 58.929 | ||
Proprietary Foundation Model Serving DBU rates
| Model | Endpoint type | Context Length | Pay Per Token | Batch Inference | |||
|---|---|---|---|---|---|---|---|
| Input | Output | Cache writes | Cache reads | ||||
| DBU / 1M Tokens | DBU / 1M Tokens | DBU / 1M Tokens | DBU / 1M Tokens | DBU / hour | |||
| Anthropic | |||||||
| Claude Opus 4.5 / 4.6 / 4.7 | Global | All Lengths | 71.429 | 357.143 | 89.286 | 7.143 | 178.571 |
| In-geo | 78.571 | 392.857 | 98.214 | 7.857 | 196.429 | ||
| Claude Opus 4 / 4.1 | Global/In-geo | All Lengths | 214.286 | 1,071.429 | 267.857 | 21.429 | 514.286 |
| Claude Sonnet 4.5 / 4.6 | Global | All Lengths | 42.857 | 214.286 | 53.571 | 4.286 | 214.286 |
| In-geo | 47.143 | 235.715 | 58.928 | 4.715 | 235.715 | ||
| Claude Sonnet 4 / 4.1 | Global/In-geo | Short Context | 42.857 | 214.286 | 53.571 | 4.286 | 214.286 |
| Long Context (>200k tokens) | 85.714 | 321.429 | 107.143 | 8.571 | 214.286 | ||
| Claude Haiku 4.5 | Global | All Lengths | 14.286 | 71.429 | 17.857 | 1.429 | 114.286 |
| In-geo | 15.715 | 78.572 | 19.643 | 1.572 | 125.714 | ||
Proprietary Foundation Model Serving DBU rates
| Model | Endpoint type | Context Length | Pay Per Token | Batch Inference | |||
|---|---|---|---|---|---|---|---|
| Input | Output | Cache writes | Cache reads | ||||
| DBU / 1M Tokens | DBU / 1M Tokens | DBU / 1M Tokens | DBU / 1M Tokens | DBU / hour | |||
| Gemini 3.1 Flash Lite | Global/In-geo | Short Context | 3.571 | 21.429 | 3.571 | 0.357 | 71.429 |
| Long Context (>200k tokens) | 3.571 | 21.429 | 3.571 | 0.357 | 71.429 | ||
| Gemini 3.1 Pro** | Global/In-geo | Short Context | 35.714 | 214.286 | 35.714 | 3.571 | 230.357 |
| Long Context (>200k tokens) | 71.429 | 321.429 | 71.429 | 7.143 | 230.357 | ||
| Gemini 3.0 Flash | Global/In-geo | Short Context | 8.929 | 53.571 | 8.929 | 0.893 | 125.000 |
| Long Context (>200k tokens) | 8.929 | 53.571 | 8.929 | 0.893 | 125.000 | ||
| Gemini 2.5 Pro | Global/In-geo | Short Context | 17.857 | 142.857 | n/a | n/a | 164.286 |
| Long Context (>200k tokens) | 35.714 | 214.286 | n/a | n/a | 164.286 | ||
| Gemini 2.5 Flash | Global/In-geo | Short Context | 4.286 | 35.714 | n/a | n/a | 107.143 |
| Long Context (>200k tokens) | 4.286 | 35.714 | n/a | n/a | 107.143 | ||
**If you are using Gemini 3 Pro, you will be automatically redirected to Gemini 3.1 Pro until June 7, 2026