파운데이션 모델 제공

실시간 및 배치 추론 워크로드 요구 사항을 모두 충족하는 최신 오픈 파운데이션 모델을 제공합니다. 이를 통해 자체 모델 배포를 유지 관리할 필요 없이 고품질의 생성 AI 모델을 활용하는 애플리케이션을 빠르고 쉽게 구축할 수 있습니다.

* 표시된 가격은 해당 지역에서의 제품 가용성을 보장하지 않습니다. 제품 가용성에 대한 자세한 내용은AWS, Azure, GCP, SAP페이지를 참조하십시오.
1. Microsoft Azure에서 제공되는 자사 서비스인 Azure Databricks는 Microsoft에서 제공하는 통합 청구 및 지원을 제공합니다.
Azure Databricks의 프리미엄 등급은 AWS 및 GCP의 엔터프라이즈 등급에 해당합니다.
2. 시간당 요금은 분 단위로 계산됩니다.
3. throughput in a single unit of PT 용량 단위의 처리량은 모델 및 query 형태(입력 토큰 대 출력 토큰)에 따라 다릅니다. GenAI 계산기 를 사용하여 워크로드별 처리량과 총비용을 예측하세요.

Foundation Model Serving DBU 요율

모델	토큰당 지불		프로비저닝된 throughput
모델	DBU / M 입력 토큰	DBU/M 출력 토큰	DBU/시간 (엔트리 용량)	시간당 DBU (스케일링 용량)
Llama 4 Maverick	7.143	21.429	85.714	85.714
Llama 3.3 70B	7.143	21.429	85.714	342.857
Qwen 3 Next 80B	2.143	17.143	78.571	78.571
Qwen 3.5 122B	3.143	31.429	85.714	85.714
GPT OSS 120B	2.143	8.571	71.429	71.429
Gemma 3 12B	2.143	7.143	71.429	71.429
Llama 3.1 8B	2.143	6.429	53.571	106.000
GPT OSS 20B	1.000	4.286	53.571	53.571
Llama 3.2 3B	해당 사항 없음	해당 사항 없음	46.429	92.857
Llama 3.2 1B	해당 사항 없음	해당 사항 없음	42.857	85.714
Qwen 3 0.6B 임베딩	0.286	해당 사항 없음	25.000	25.000
GTE	1.857	해당 사항 없음	20.000	20.000
BGE 대형	1.429	해당 사항 없음	24.000	24.000

¹: 진입 용량은 고객이 더 저렴한 비용으로 시작할 수 있도록 설계된 소규모의 저비용 PT 용량 단위입니다. 이는 확장 용량에 비해 비례적으로 감소된 처리량을 제공합니다. 이는 미국, 캐나다, 브라질 리전의 Azure 및 AWS에서 기본(미세 조정되지 않은) 모델에만 사용할 수 있습니다.

²: 확장 용량은 모델에 프로비저닝할 수 있는 표준 PT 용량 증분입니다. 엔트리 용량(일부 클라우드 및 리전에서 사용 가능)을 초과하면 프로비저닝된 throughput 용량은 이러한 확장 용량 단위로 확장 및 축소됩니다. 진입 용량을 사용할 수 없는 클라우드/리전에서는 최소 PT 구매 증분은 전체 확장 용량 단위입니다.

14일 무료 체험 후 사용한 만큼 지불하거나 약정 사용 할인 또는 맞춤 요구 사항은 상담을 통해 문의하세요.

무료 체험 시작 문의