1. 사용 시나리오

입력 토큰보내는 텍스트 양
출력 토큰AI가 생성하는 응답 양
추론 토큰
AI가 생각하는 과정 (일부 모델만 지원)
API 횟수총 요청 횟수
프롬프트 캐시반복 요청 시 입력의 80%를 재사용하여 비용 절감
속도 표시

프롬프트 직접 입력 (선택사항)

2. 비용 시뮬레이션

모델총 최소~총 최대
OpenAI text-embedding-3-small
$0.060~0.060
GPT OSS 120B
$1.30~2.17
Llama 4 Scout
$1.32~2.76
Nemotron 3 Nano 30B A3B
$1.47~2.43
DeepSeek V4 Flash
$2.27~3.61
Grok 4.1 Fast
$2.40~4.80
Llama 4 Maverick
$2.61~5.49
GPT-5 Nano
$2.79~4.71
Gemma 4 31B
$2.90~4.72
Dola Seed 2.0 mini
$2.94~4.86
Gemini 2.5 Flash Lite
$2.94~4.86
Nemotron 3 Super
$3.24~5.40
DeepSeek V3.2
$3.25~5.07
Longcat Flash Chat
$3.48~7.32
Grok 4.1 Fast (Reasoning)
$3.90~6.30
Mistral Small 4
$4.41~7.29
K-EXAONE
$5.88~9.72
Trinity Large Thinking
$6.27~10.35
DeepSeek V4 Pro
$7.05~11.22
MiniMax M2.5
$8.04~13.56
ERNIE 4.5 300B A47B
$8.10~13.38
MiniMax M2.7
$8.82~14.58
GPT-5.4 Nano
$8.85~14.85
Gemini 3.1 Flash Lite
$10.65~17.85
Qwen3.6 Flash
$10.65~17.85
Grok 4.20
$12.75~24.75
Qwen3.6 Plus
$13.84~23.20
Dola Seed 2.0 Lite
$13.95~23.55
GPT-5 Mini
$13.95~23.55
MiMo V2.5
$14.40~24.00
GLM-5
$14.47~23.69
Kimi K2.5
$14.52~24.12
Qwen3.5 397B A17B
$16.61~27.85
Gemini 2.5 Flash
$17.40~29.40
Nova 2 Lite
$17.40~29.40
Grok 4.20 (Reasoning)
$20.25~32.25
Grok 4.3
$20.25~32.25
Dola Seed 2.0 Pro
$21.30~35.70
Gemini 3 Flash
$21.30~35.70
MiMo V2 Pro
$22.80~37.20
MiMo V2.5 Pro
$22.80~37.20
Kimi K2.6
$25.35~42.15
GLM-5.1
$26.25~43.05
GLM 5V Turbo
$30.00~49.20
GPT-5.4 Mini
$31.95~53.55
GPT-4.1
$34.80~73.20
Claude Haiku 4.5
$36.00~60.00
Qwen3.6 Max
$44.30~74.26
Mistral Medium 3.5
$54.00~90.00
Gemini 2.5 Pro
$69.75~117.75
GPT-5
$69.75~117.75
Gemini 3.1 Pro
$85.20~142.80
GPT-5.4
$106.50~178.50
Claude Sonnet 4
$108.00~180.00
Claude Sonnet 4.5
$108.00~180.00
Claude Sonnet 4.6
$108.00~180.00
Claude Opus 4.5
$180.00~300.00
Claude Opus 4.6
$180.00~300.00
Claude Opus 4.7
$180.00~300.00
GPT-5.5
$213.00~357.00
Claude Opus 4
$540.00~900.00
Claude Opus 4.1
$540.00~900.00
GPT-5.4 Pro
$1278.00~2142.00
GPT-5.5 Pro
$1278.00~2142.00

4. 시뮬레이션 요약

최저 비용 모델

OpenAI text-embedding-3-small

$0.060 /3,000

최고 성능 모델

GPT-5.5

$213.00 /3,000

산출 기준

입력 토큰: 1,000

출력 토큰: 1,200 ~ 2,800 (±40%)

추론 토큰: 1,000

사용량: 3,000

토큰 프리셋은 시나리오별 통계적 평균값입니다. 실제 토큰 수는 프롬프트 내용에 따라 달라집니다. Reasoning 토큰은 Extended Thinking을 지원하는 모델에만 적용됩니다.

단가 최종 업데이트: 2026년 5월 7일