AIモデル比較

MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。

提供元

MiniMax

リリース日

2026-02-12

学習完了日

非公開

ライセンス

公開モデル

入出力形式

コンテキスト長

197K / 66K

API入出力 (1M)

$0.15 / $1.15

利用方法

API連携

出力速度

77 tok/s

Arena 総合

1397

Intelligence Index

41.9

Coding Index

37.4

Math Index

—

LiveBench

60.3

ForecastBench

—

GPQA Diamond

84.8%

HLE

19.1%

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 推論

59.3

LB 数学

77.4

LB データ分析

49.6

LiveCodeBench

—

LB コーディング

70.7

LB エージェンティック

51.7

TAU2

95.3%

TerminalBench

34.8%

SciCode

42.6%

IFBench

71.6%

AA-LCR

0.7

幻覚率 (HHEM)

—

事実一貫性 (HHEM)

—

LB 言語

55.1

LB 指示

57.2

コスト計算 AIモデル詳細ページ

1 / 3

左右にスワイプ

提供元