API Cost Calculator — AI Model Pricing Simulator | aib

1. Use case

Input tokensText you send to the AI

Output tokensResponse the AI generates

Reasoning tokens

AI's thinking process (some models only)

API callsTotal number of requests

Prompt cacheReuses 80% of repeated input to reduce cost

Show speed

Paste your prompt (optional)

2. Cost simulation

Model	Total Min	Total Max	Total Min~Total Max	Unit
OpenAI text-embedding-3-small	$0.060	$0.060	$0.060~0.060	$0.020/1M
GPT OSS 120B	$1.30	$2.17	$1.30~2.17	$0.039/1M
Llama 4 Scout	$1.32	$2.76	$1.32~2.76	$0.080/1M
Nemotron 3 Nano 30B A3B	$1.47	$2.43	$1.47~2.43	$0.050/1M
DeepSeek V4 Flash	$2.27	$3.61	$2.27~3.61	$0.140/1M
Grok 4.1 Fast	$2.40	$4.80	$2.40~4.80	$0.200/1M
Llama 4 Maverick	$2.61	$5.49	$2.61~5.49	$0.150/1M
GPT-5 Nano	$2.79	$4.71	$2.79~4.71	$0.050/1M
Gemma 4 31B	$2.90	$4.72	$2.90~4.72	$0.130/1M
Dola Seed 2.0 mini	$2.94	$4.86	$2.94~4.86	$0.100/1M
Gemini 2.5 Flash Lite	$2.94	$4.86	$2.94~4.86	$0.100/1M
Nemotron 3 Super	$3.24	$5.40	$3.24~5.40	$0.090/1M
DeepSeek V3.2	$3.25	$5.07	$3.25~5.07	$0.252/1M
Longcat Flash Chat	$3.48	$7.32	$3.48~7.32	$0.200/1M
Grok 4.1 Fast (Reasoning)	$3.90	$6.30	$3.90~6.30	$0.200/1M
Mistral Small 4	$4.41	$7.29	$4.41~7.29	$0.150/1M
K-EXAONE	$5.88	$9.72	$5.88~9.72	$0.200/1M
Trinity Large Thinking	$6.27	$10.35	$6.27~10.35	$0.220/1M
DeepSeek V4 Pro	$7.05	$11.22	$7.05~11.22	$0.435/1M
MiniMax M2.5	$8.04	$13.56	$8.04~13.56	$0.150/1M
ERNIE 4.5 300B A47B	$8.10	$13.38	$8.10~13.38	$0.280/1M
MiniMax M2.7	$8.82	$14.58	$8.82~14.58	$0.300/1M
GPT-5.4 Nano	$8.85	$14.85	$8.85~14.85	$0.200/1M
Gemini 3.1 Flash Lite	$10.65	$17.85	$10.65~17.85	$0.250/1M
Qwen3.6 Flash	$10.65	$17.85	$10.65~17.85	$0.250/1M
Grok 4.20	$12.75	$24.75	$12.75~24.75	$1.25/1M
Qwen3.6 Plus	$13.84	$23.20	$13.84~23.20	$0.325/1M
Dola Seed 2.0 Lite	$13.95	$23.55	$13.95~23.55	$0.250/1M
GPT-5 Mini	$13.95	$23.55	$13.95~23.55	$0.250/1M
MiMo V2.5	$14.40	$24.00	$14.40~24.00	$0.400/1M
GLM-5	$14.47	$23.69	$14.47~23.69	$0.600/1M
Kimi K2.5	$14.52	$24.12	$14.52~24.12	$0.440/1M
Qwen3.5 397B A17B	$16.61	$27.85	$16.61~27.85	$0.390/1M
Gemini 2.5 Flash	$17.40	$29.40	$17.40~29.40	$0.300/1M
Nova 2 Lite	$17.40	$29.40	$17.40~29.40	$0.300/1M
Grok 4.20 (Reasoning)	$20.25	$32.25	$20.25~32.25	$1.25/1M
Grok 4.3	$20.25	$32.25	$20.25~32.25	$1.25/1M
Dola Seed 2.0 Pro	$21.30	$35.70	$21.30~35.70	$0.500/1M
Gemini 3 Flash	$21.30	$35.70	$21.30~35.70	$0.500/1M
MiMo V2 Pro	$22.80	$37.20	$22.80~37.20	$1.00/1M
MiMo V2.5 Pro	$22.80	$37.20	$22.80~37.20	$1.00/1M
Kimi K2.6	$25.35	$42.15	$25.35~42.15	$0.750/1M
GLM-5.1	$26.25	$43.05	$26.25~43.05	$1.05/1M
GLM 5V Turbo	$30.00	$49.20	$30.00~49.20	$1.20/1M
GPT-5.4 Mini	$31.95	$53.55	$31.95~53.55	$0.750/1M
GPT-4.1	$34.80	$73.20	$34.80~73.20	$2.00/1M
Claude Haiku 4.5	$36.00	$60.00	$36.00~60.00	$1.00/1M
Qwen3.6 Max	$44.30	$74.26	$44.30~74.26	$1.04/1M
Mistral Medium 3.5	$54.00	$90.00	$54.00~90.00	$1.50/1M
Gemini 2.5 Pro	$69.75	$117.75	$69.75~117.75	$1.25/1M
GPT-5	$69.75	$117.75	$69.75~117.75	$1.25/1M
Gemini 3.1 Pro	$85.20	$142.80	$85.20~142.80	$2.00/1M
GPT-5.4	$106.50	$178.50	$106.50~178.50	$2.50/1M
Claude Sonnet 4	$108.00	$180.00	$108.00~180.00	$3.00/1M
Claude Sonnet 4.5	$108.00	$180.00	$108.00~180.00	$3.00/1M
Claude Sonnet 4.6	$108.00	$180.00	$108.00~180.00	$3.00/1M
Claude Opus 4.5	$180.00	$300.00	$180.00~300.00	$5.00/1M
Claude Opus 4.6	$180.00	$300.00	$180.00~300.00	$5.00/1M
Claude Opus 4.7	$180.00	$300.00	$180.00~300.00	$5.00/1M
GPT-5.5	$213.00	$357.00	$213.00~357.00	$5.00/1M
Claude Opus 4	$540.00	$900.00	$540.00~900.00	$15.00/1M
Claude Opus 4.1	$540.00	$900.00	$540.00~900.00	$15.00/1M
GPT-5.4 Pro	$1278.00	$2142.00	$1278.00~2142.00	$30.00/1M
GPT-5.5 Pro	$1278.00	$2142.00	$1278.00~2142.00	$30.00/1M

4. Simulation summary

Cheapest model

OpenAI text-embedding-3-small

$0.060 /3,000calls

Best performance model

GPT-5.5

$213.00 /3,000calls

Calculation basis

Input tokens: 1,000

Output tokens: 1,200 ~ 2,800 (±40%)

Reasoning tokens: 1,000

Usage: 3,000 calls

Token presets are statistical averages for each scenario. Actual token counts vary depending on prompt content. Reasoning tokens only apply to models that support Extended Thinking.

Pricing last updated: 2026년 5월 7일