OpenAI
OpenAI

GPT OSS 120B

2025-08-05

GPT-OSS-120Bは、OpenAI初のオープンウェイト言語モデルで、総パラメータ数1,170億の混合エキスパート(MoE)アーキテクチャにおいて、1回の順伝播あたり51億パラメータのみを活性化します。ネイティブMXFP4量子化により80GB GPU1枚で動作可能で、主要な推論ベンチマークでo4-miniに迫る性能を達成します。思考深度の調整、完全な思考連鎖へのアクセス、関数呼び出しや構造化出力などのツール使用に対応しており、Apache 2.0ライセンスで公開されているため、ローカル環境で自由に活用できます。

API|深い思考|公開モデルApache 2.0
学習完了日
2024-06-30
入力形式 → 出力形式
処理容量
131KIN131KOUT
単価(100万文字)
$0.039IN$0.18OUT
費用を計算する

AI性能評価

Arena 総合点数
1353
±4
集計日 2026-05-01
総合ランク
160位
30,670 投票数
Arena 能力別スコア
日本語能力
1318±2792位
複雑な質問
1362±6165位
専門知識
1360±17156位
指示遂行
1326±7172位
会話記憶
1328±9180位
創造力
1279±10212位
コード作成
1390±8163位
数学力
1383±14133位
Arena 職種別スコア
文学·創作
1310±8186位
生活·社会
1361±9169位
エンタメ
1287±8193位
経営·金融
1350±8163位
医学·保健
1369±15159位
法律·行政
1345±14179位
ソフト開発
1386±6162位
数学·統計
1384±15134位
総合
AA Intelligence Index
25%↓15%
LiveBench
46%↓14%
推論·数学
AA Math Index
67%↓8%
GPQA Diamond
67%↓15%
HLE
5.2%↓12%
MMLU-Pro
78%↓4%
AIME 2025
67%↓8%
LB 推論
39%↓30%
LB 数学
69%↓5%
LB データ
39%↓14%
コーディング
AA Coding Index
16%↓21%
LiveCodeBench
71%↑5%
LB コード
60%↓13%
LB エージェント
17%↓28%
TAU2
45%↓35%
TerminalBench
5.3%↓29%
SciCode
36%↓6%
言語·指示
IFBench
58%↓5%
AA-LCR
44%↓18%
幻覚率 (HHEM)
14%↑4%
事実一貫性 (HHEM)
86%↓4%
LB 言語
49%↓24%
LB 指示
50%↓1%
出力速度
標準モード
86tok/s↑9
出力開始 0.48s
推論モード
233tok/s↑146
出力開始 9.09s