Grok 4.1 Fastは、xAIのエージェント型ツール呼び出しモデルで、カスタマーサポートやディープリサーチなど実務での活用に最適化されています。西洋のフロンティアモデルの中で最大の200万トークンコンテキストウィンドウを備え、情報探索タスクでのハルシネーション率の大幅な低減に注力しています。APIのreasoningパラメータで推論モードの有効・無効を切り替えられ、速度重視の直接回答と深い分析的回答を選択できます。
xAI SuperGrokxAI SuperGrok HeavyAPI|ビジョンWeb検索ファイル|商用モデル
AI性能評価
Arena 総合点数
1432
±4集計日 2026-05-01
総合ランク
63位
48,702 投票数
Arena 能力別スコア
日本語能力
1373±3554位
複雑な質問
1442±477位
専門知識
1441±1179位
指示遂行
1401±694位
会話記憶
1417±787位
創造力
1410±753位
コード作成
1465±681位
数学力
1423±1172位
Arena 職種別スコア
文学·創作
1403±675位
生活·社会
1450±762位
エンタメ
1400±762位
経営·金融
1417±776位
医学·保健
1447±1172位
法律·行政
1427±1180位
ソフト開発
1460±570位
数学·統計
1423±1376位
総合
AA Intelligence Index
24%↓16%
LiveBench
32%↓29%
ForecastBench
56%↓4%
推論·数学
AA Math Index
34%↓40%
GPQA Diamond
64%↓18%
HLE
5.0%↓13%
MMLU-Pro
74%↓7%
AIME 2025
34%↓40%
LB 推論
23%↓46%
LB 数学
39%↓35%
LB データ
41%↓13%
コーディング
AA Coding Index
20%↓17%
LiveCodeBench
40%↓26%
LB コード
54%↓19%
LB エージェント
10%↓35%
TAU2
64%↓17%
TerminalBench
14%↓20%
SciCode
30%↓12%
言語·指示
IFBench
37%↓27%
AA-LCR
22%↓40%
幻覚率 (HHEM)
18%↑8%
事実一貫性 (HHEM)
82%↓8%
LB 言語
50%↓22%
LB 指示
17%↓34%
出力速度
標準モード
79tok/s↑2
出力開始 0.45s
推論モード
94tok/s↑7
出力開始 11.80s