MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。
提供元
リリース日
2026-02-12
学習完了日
非公開
ライセンス
公開モデル
入出力形式
コンテキスト長
197K / 66K
API入出力 (1M)
$0.15 / $1.15
利用方法
API連携
出力速度
77 tok/sArena 総合
1397Intelligence Index
41.9Coding Index
37.4Math Index
—LiveBench
60.3ForecastBench
—GPQA Diamond
84.8%HLE
19.1%MMLU-Pro
—AIME 2025
—MATH-500
—LB 推論
59.3LB 数学
77.4LB データ分析
49.6LiveCodeBench
—LB コーディング
70.7LB エージェンティック
51.7TAU2
95.3%TerminalBench
34.8%SciCode
42.6%IFBench
71.6%AA-LCR
0.7幻覚率 (HHEM)
—事実一貫性 (HHEM)
—LB 言語
55.1LB 指示
57.21 / 3
左右にスワイプ
MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。
提供元
リリース日
2026-02-12
学習完了日
非公開
ライセンス
公開モデル
入出力形式
コンテキスト長
197K / 66K
API入出力 (1M)
$0.15 / $1.15
利用方法
API連携
出力速度
77 tok/sArena 総合
1397Intelligence Index
41.9Coding Index
37.4Math Index
—LiveBench
60.3ForecastBench
—GPQA Diamond
84.8%HLE
19.1%MMLU-Pro
—AIME 2025
—MATH-500
—LB 推論
59.3LB 数学
77.4LB データ分析
49.6LiveCodeBench
—LB コーディング
70.7LB エージェンティック
51.7TAU2
95.3%TerminalBench
34.8%SciCode
42.6%IFBench
71.6%AA-LCR
0.7幻覚率 (HHEM)
—事実一貫性 (HHEM)
—LB 言語
55.1LB 指示
57.2