OpenAI

GPT-5.4

Name: OpenAI GPT-5.4
Author: OpenAI

比較

Model ID:gpt-5.4-2026-03-05

2026-03-05

比較

GPT-5.4は、2026年3月にリリースされたOpenAIの最新フロンティアモデルで、CodexとGPT製品ラインを単一のシステムに統合しました。100万トークン以上のコンテキストウィンドウ、ネイティブのコンピュータ操作機能、GPT-5.3-Codexから継承した最高水準のコーディング性能を備えています。GPT-5.2と比較してトークン効率が大幅に向上し、44職種にわたる知識作業ベンチマークで専門家と83%同等以上の成果を達成しています。エージェント型コーディング、ドキュメント理解、ツール活用、複雑な多段階ワークフローに優れています。

OpenAI PlusOpenAI ProAPI|ビジョン深い思考Web検索ファイル|商用モデル

学習完了日

2025-08-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

1.1MIN128KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$2.5IN$15OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

費用を計算する

出典:公式ドキュメント OpenAI GPT-5 Blog LMSYS Chatbot Arena OpenRouter

AI性能評価

Arena 総合点数

1477

±5

集計日 2026-05-01

総合ランク

11位

15,853 投票数

Arena 能力別スコア

日本語能力

1478±557位

複雑な質問

1502±79位

専門知識

1524±176位

指示遂行

1480±98位

会話記憶

1497±117位

創造力

1444±1322位

コード作成

1527±108位

数学力

1514±18🥇 1位

Arena 職種別スコア

文学·創作

1467±108位

生活·社会

1480±1230位

エンタメ

1448±1215位

経営·金融

1483±1110位

医学·保健

1471±1942位

法律·行政

1476±1826位

ソフト開発

1510±816位

数学·統計

1516±205位

出典:Arena Intelligence

総合

AA Intelligence Index

57%↑18%

LiveBench

81%↑20%

ForecastBench

59%↓1%

推論·数学

GPQA Diamond

92%↑10%

HLE

42%↑24%

LB 推論

88%↑19%

LB 数学

94%↑20%

LB データ

79%↑26%

コーディング

AA Coding Index

57%↑21%

LB コード

78%↑5%

LB エージェント

70%↑25%

TAU2

87%↑7%

TerminalBench

58%↑23%

SciCode

57%↑15%

言語·指示

IFBench

74%↑11%

AA-LCR

74%↑12%

幻覚率 (HHEM)

7.0%↓3%

事実一貫性 (HHEM)

93%↑3%

LB 言語

83%↑10%

LB 指示

70%↑19%

出力速度

標準モード

155tok/s↑78

出力開始 0.49s

推論モード

158tok/s↑71

出力開始 3.64s

出典:Artificial Analysis LiveBench ForecastBench Vectara HHEM

多言語能力

MGSM 🇰🇷

94%

MGSM 🇯🇵

92%

KMMLU 🇰🇷

77%

JMMLU 🇯🇵

75%

OpenAI