Anthropic
Anthropic

Claude Opus 4

2025-05-22

Claude Opus 4は、2025年5月にリリースされたAnthropicの画期的なコーディング・エージェントモデルで、複雑な長時間タスクにおける持続的な性能で新たな基準を打ち立てました。SWE-bench(72.5%)とTerminal-bench(43.2%)でトップを記録し、数千ステップにわたるエージェントワークフローを性能低下なく数時間にわたって連続処理できます。ハイブリッドモデルとして即座の応答と深い推論のための拡張思考モードの両方に対応し、並列ツール使用と向上した指示記憶能力を備えています。

API|ビジョン深い思考Web検索ファイル|商用モデル
学習完了日
2025-05-01
入力形式 → 出力形式
処理容量
1MIN128KOUT
単価(100万文字)
$15IN$75OUT
費用を計算する

AI性能評価

Arena 総合点数
1424
±4
集計日 2026-05-01
総合ランク
73位
36,941 投票数
Arena 能力別スコア
日本語能力
1385±2338位
複雑な質問
1456±658位
専門知識
1446±1474位
指示遂行
1443±737位
会話記憶
1437±862位
創造力
1429±938位
コード作成
1498±840位
数学力
1419±1276位
Arena 職種別スコア
文学·創作
1429±743位
生活·社会
1438±876位
エンタメ
1420±846位
経営·金融
1412±890位
医学·保健
1445±1375位
法律·行政
1435±1271位
ソフト開発
1466±661位
数学·統計
1424±1375位
総合
AA Intelligence Index
39%↑0%
ForecastBench
61%↑1%
推論·数学
AA Math Index
73%↓1%
GPQA Diamond
80%↓3%
HLE
12%↓6%
MMLU-Pro
87%↑6%
AIME 2025
73%↓1%
MATH-500
98%↑5%
コーディング
AA Coding Index
34%↓2%
LiveCodeBench
64%↓2%
TAU2
73%↓7%
TerminalBench
31%↓3%
SciCode
40%↓2%
言語·指示
IFBench
54%↓9%
AA-LCR
34%↓28%
幻覚率 (HHEM)
12%↑2%
事実一貫性 (HHEM)
88%↓2%
出力速度
標準モード
34tok/s↓43
出力開始 1.33s
推論モード
35tok/s↓52
出力開始 7.61s