MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。
API|深い思考|公開モデルModified MIT
AI性能評価
Arena 総合点数
1397
±5集計日 2026-05-01
総合ランク
112位
23,488 投票数
Arena 能力別スコア
日本語能力
1205±54161位
複雑な質問
1422±6101位
専門知識
1436±1482位
指示遂行
1395±7102位
会話記憶
1406±9105位
創造力
1373±10106位
コード作成
1454±897位
数学力
1407±1596位
Arena 職種別スコア
文学·創作
1382±8102位
生活·社会
1410±10115位
エンタメ
1378±995位
経営·金融
1411±994位
医学·保健
1407±15123位
法律·行政
1410±15102位
ソフト開発
1440±7100位
数学·統計
1409±17106位
総合
AA Intelligence Index
42%↑3%
LiveBench
60%↑0%
推論·数学
GPQA Diamond
85%↑3%
HLE
19%↑2%
LB 推論
59%↓10%
LB 数学
77%↑3%
LB データ
50%↓4%
コーディング
AA Coding Index
37%↑1%
LB コード
71%↓2%
LB エージェント
52%↑7%
TAU2
95%↑15%
TerminalBench
35%↑1%
SciCode
43%↑1%
言語·指示
IFBench
72%↑8%
AA-LCR
66%↑4%
LB 言語
55%↓17%
LB 指示
57%↑6%
出力速度
標準モード
77tok/s↑0
出力開始 27.42s