주요 컨텐츠로 이동

독점 파운데이션 모델 서빙

실시간 및 배치 추론 워크로드 요구 사항을 모두 충족하는 최신 오픈 파운데이션 모델을 제공합니다. 이를 통해 다른 공급업체와 별도로 계약하지 않고도 Databricks 플랫폼에서 바로 다양한 공급업체의 고품질 독점 생성형 AI 모델을 활용하는 애플리케이션을 빠르고 쉽게 빌드할 수 있습니다.

Loading...

독점 파운데이션 모델 서빙 DBU 요율

모델 토큰당 과금
 100만 개의 입력 토큰당 DBU
(전역)
100만 개의 출력 토큰당 DBU
(전역)
OpenAI
GPT 5글로벌17.857142.857
지역 내19.643157.143
GPT 5 Mini글로벌3.57128.571
지역 내3.92931.429
GPT 5 Nano글로벌0.7145.714
지역 내0.7866.286
Anthropic
Claude Opus 4.1글로벌214.2861,071.43
Claude Sonnet 4.5글로벌42.857214.286
지역 내47.143235.715
Claude Sonnet 4글로벌42.857214.286
Claude Sonnet 3.7글로벌42.857214.286

Proprietary Foundation Model Serving DBU rates

ModelEndpoint typeContext Length

Pay Per Token

Batch Inference
InputOutputCache writesCache reads 
DBU / 1M TokensDBU / 1M TokensDBU / 1M TokensDBU / 1M TokensDBU / hour
OpenAI
GPT 5.2GlobalAll Lengths25.000200.00025.0002.500184.286
In-geo27.500220.00027.5002.750202.714
GPT 5.1GlobalAll Lengths17.857142.85717.8571.786131.429
In-geo19.643157.14319.6431.965144.571
GPT 5.1 Codex MaxGlobalAll Lengths17.857142.85717.8571.786131.429
In-geo19.643157.14319.6431.965144.571
GPT 5GlobalAll Lengths17.857142.85717.8571.786131.429
In-geo19.643157.14319.6431.965144.571
GPT 5 miniGlobalAll Lengths3.57128.5713.5710.35771.429
In-geo3.92931.4293.9290.39378.571
GPT 5.1 Codex MiniGlobalAll Lengths3.57128.5713.5710.35771.429
In-geo3.92931.4293.9290.39378.571
GPT 5 nanoGlobalAll Lengths0.7145.7140.7140.07153.571
In-geo0.7866.2860.7860.07858.929

Proprietary Foundation Model Serving DBU rates

ModelEndpoint typeContext Length

Pay Per Token

Batch Inference
InputOutputCache writesCache reads 
DBU / 1M TokensDBU / 1M TokensDBU / 1M TokensDBU / 1M TokensDBU / hour
Anthropic
Claude Opus 4.6GlobalShort Context71.429357.14389.2867.143178.571
In-geo78.571392.85798.2147.857196.429
GlobalLong Context
(>200k tokens)
142.858535.715178.57214.286178.571
In-geo157.142589.286196.42815.714196.429
Claude Opus 4.5GlobalShort Context71.429357.14389.2867.143178.571
In-geo78.571392.85798.2147.857196.429
Claude Opus 4 / 4.1Global/In-geoAll Lengths214.2861,071.429267.85721.429514.286
Claude Sonnet 4.5 / 4.6GlobalShort Context42.857214.28653.5714.286214.286
In-geo47.143235.71558.9284.715235.715
GlobalLong Context
(>200k tokens)
85.714321.429107.1438.571214.286
In-geo94.285353.572117.8579.428235.715
Claude Sonnet 3.7 / 4 / 4.1

Claude 3.7 Sonnet will be deprecated on April 12, 2026
Global/In-geoShort Context42.857214.28653.5714.286214.286
Long Context
(>200k tokens)
85.714321.429107.1438.571214.286
Claude Haiku 4.5GlobalAll Lengths14.28671.42917.8571.429114.286
In-geo15.71578.57219.6431.572125.714

Proprietary Foundation Model Serving DBU rates

ModelEndpoint typeContext Length

Pay Per Token

Batch Inference
InputOutputCache writesCache reads 
DBU / 1M TokensDBU / 1M TokensDBU / 1M TokensDBU / 1M TokensDBU / hour
Google
Gemini 3.0/3.1 ProGlobal/In-geoShort Context35.714214.28635.7143.571230.357
Long Context
(>200k tokens)
71.429321.42971.4297.143230.357
Gemini 3.0 FlashGlobal/In-geoShort Context8.92953.5718.9290.893125.000
Long Context
(>200k tokens)
8.92953.5718.9290.893125.000
Gemini 2.5 ProGlobal/In-geoShort Context17.857142.857n/an/a164.286
Long Context
(>200k tokens)
35.714214.286n/an/a164.286
Gemini 2.5 FlashGlobal/In-geoShort Context4.28635.714n/an/a107.143
Long Context
(>200k tokens)
4.28635.714n/an/a107.143

14일 무료 체험 후 사용한 만큼 지불하거나 약정 사용 할인 또는 맞춤 요구 사항은 상담을 통해 문의하세요.

독점 파운데이션 모델 서빙 관련 자주 묻는 질문