Claude Opus 4.6は、2026年2月にリリースされたAnthropicの最高知能モデルで、単一のプロンプトではなくワークフロー全体にまたがるエージェント向けに設計されています。100万トークンのコンテキストウィンドウ、最大128Kの出力トークン、複数のサブエージェントを並列に生成・調整するエージェントチーム機能を備えています。推論の深さを動的に調整する適応型思考により、大規模コードベース、複雑なリファクタリング、長期的な知識作業、エンドツーエンドのプロジェクト遂行に優れ、一度の生成でほぼ完成度の高いドキュメントと分析を作成します。
Anthropic ProAnthropic Max (5x)Anthropic Max (20x)API|ビジョン深い思考Web検索|商用モデル
AI性能評価
Arena 総合点数
1502
±5集計日 2026-05-01
総合ランク
🥈 2位
22,385 投票数
Arena 能力別スコア
日本語能力
1507±48🥈 2位
複雑な質問
1536±6🥇 1位
専門知識
1544±15🥈 2位
指示遂行
1518±8🥇 1位
会話記憶
1515±10🥈 2位
創造力
1493±11🥈 2位
コード作成
1554±9🥈 2位
数学力
1513±16🥈 2位
Arena 職種別スコア
文学·創作
1496±9🥈 2位
生活·社会
1517±10🥈 2位
エンタメ
1487±10🥇 1位
経営·金融
1502±10🥉 3位
医学·保健
1514±155位
法律·行政
1510±15🥉 3位
ソフト開発
1542±7🥈 2位
数学·統計
1519±18🥈 2位
総合
AA Intelligence Index
53%↑14%
LiveBench
77%↑16%
ForecastBench
60%↑0%
推論·数学
GPQA Diamond
90%↑7%
HLE
37%↑19%
LB 推論
89%↑20%
LB 数学
89%↑15%
LB データ
70%↑17%
コーディング
AA Coding Index
48%↑12%
LB コード
78%↑5%
LB エージェント
62%↑17%
TAU2
92%↑12%
TerminalBench
46%↑12%
SciCode
52%↑10%
言語·指示
IFBench
53%↓10%
AA-LCR
71%↑9%
幻覚率 (HHEM)
12%↑2%
事実一貫性 (HHEM)
88%↓2%
LB 言語
83%↑11%
LB 指示
63%↑12%
出力速度
標準モード
45tok/s↓32
出力開始 1.75s
推論モード
50tok/s↓37
出力開始 11.83s