주요 컨텐츠로 이동

Mosaic AI 파운데이션 Model Serving

두 가지 구매 방법

Pricing

Access and query state-of-the-art open foundation models and use them to quickly and easily build applications that leverage a high-quality generative AI model without maintaining your own model deployment.

플랜 선택

선택 도움말

클라우드 선택

Select model

Select
Loading...

파운데이션 모델 온디맨드 가격

모델가격 / 1M 입력 토큰
(미국 동부 유효 가격)
가격 / 1M 출력 토큰
(미국 동부 유효 가격)
DBU / 100만 토큰(모든 지역)
DBRX$2.25$6.7532.143(입력)/96.429(출력)
LLaMa-2-70B$2.00$2.0028.571
Mixtral-8-7B$1.50$1.5021.429
MPT-30B$1.00$1.0014.286
LLaMa-2-13B$0.95$0.9513.571
MPT-7B$0.50$0.507.143
BGE-L$0.10$0.101.429

파운데이션 모델 프로비저닝 throughput 가격

모델가격/단위/시간1
(미국 동부 유효 가격)
시간당 DBU(모든 지역)
DBRX$14.85212.143
70B 모델$11.00157.143
30B 모델$7.84112.000
13B 모델$5.5078.571
Mixtral 8 7B$20.36290.857
7B 모델$1.4020.000

1 - 최소 단위 및 구성은 클라우드에 따라 다릅니다.

온디맨드(토큰당) 가격 예시

모델입력 토큰출력 토큰지역제공
가격/DBU
총 가격
DBRX4,000,0001,000,000미국 동부$0.070$15.75
LLaMa-2-70B4,000,0001,000,000미국 동부$0.070$10.00
Mixtral-8-7B4,000,0001,000,000AP(시드니)$0.088$9.43

프로비저닝된 throughput 가격 예시

모델시간/월지역제공
가격/DBU
월별 가격*
DBRX720미국 동부$0.070$10,692
LLaMa-2-70B720미국 동부$0.070$7,920
Mixtral-8-7B720AP(시드니)$0.088$18,429

* throughput 대역별

프로비저닝된 throughput 예상 토큰 용량

모델일반적인 워크로드 throughput 대역별 초당 최대 토큰
DBRX600
LLaMa-2-70B635
Mixtral-8-7B1,700
MPT-30B450
LLaMa-2-13B980
MPT-7B2,450

Pay as you go with a 14-day free trial or contact us for committed-use discounts or custom requirements.

Mosaic AI Model Serving 자주 묻는 질문

지역별 가격은 당사 서버리스 제품을 지원하는 인프라의 지역별 비용에 따라 산정했습니다.