OpenAI
OpenAI

GPT-5.4

2026-03-05

GPT-5.4は、2026年3月にリリースされたOpenAIの最新フロンティアモデルで、CodexとGPT製品ラインを単一のシステムに統合しました。100万トークン以上のコンテキストウィンドウ、ネイティブのコンピュータ操作機能、GPT-5.3-Codexから継承した最高水準のコーディング性能を備えています。GPT-5.2と比較してトークン効率が大幅に向上し、44職種にわたる知識作業ベンチマークで専門家と83%同等以上の成果を達成しています。エージェント型コーディング、ドキュメント理解、ツール活用、複雑な多段階ワークフローに優れています。

OpenAI PlusOpenAI ProAPI|ビジョン深い思考Web検索ファイル|商用モデル
学習完了日
2025-08-31
入力形式 → 出力形式
処理容量
1.1MIN128KOUT
単価(100万文字)
$2.5IN$15OUT
費用を計算する

AI性能評価

Arena 総合点数
1477
±5
集計日 2026-05-01
総合ランク
11位
15,853 投票数
Arena 能力別スコア
日本語能力
1478±557位
複雑な質問
1502±79位
専門知識
1524±176位
指示遂行
1480±98位
会話記憶
1497±117位
創造力
1444±1322位
コード作成
1527±108位
数学力
1514±18🥇 1位
Arena 職種別スコア
文学·創作
1467±108位
生活·社会
1480±1230位
エンタメ
1448±1215位
経営·金融
1483±1110位
医学·保健
1471±1942位
法律·行政
1476±1826位
ソフト開発
1510±816位
数学·統計
1516±205位
総合
AA Intelligence Index
57%↑18%
LiveBench
81%↑20%
ForecastBench
59%↓1%
推論·数学
GPQA Diamond
92%↑10%
HLE
42%↑24%
LB 推論
88%↑19%
LB 数学
94%↑20%
LB データ
79%↑26%
コーディング
AA Coding Index
57%↑21%
LB コード
78%↑5%
LB エージェント
70%↑25%
TAU2
87%↑7%
TerminalBench
58%↑23%
SciCode
57%↑15%
言語·指示
IFBench
74%↑11%
AA-LCR
74%↑12%
幻覚率 (HHEM)
7.0%↓3%
事実一貫性 (HHEM)
93%↑3%
LB 言語
83%↑10%
LB 指示
70%↑19%
出力速度
標準モード
155tok/s↑78
出力開始 0.49s
推論モード
158tok/s↑71
出力開始 3.64s

多言語能力

MGSM 🇰🇷
94%
MGSM 🇯🇵
92%
KMMLU 🇰🇷
77%
JMMLU 🇯🇵
75%