NVIDIA

Nemotron 3 Nano Omni

Name: NVIDIA Nemotron 3 Nano Omni
Author: NVIDIA

体験比較

2026-04-28

体験比較

NVIDIA Nemotron™ 3 Nano Omniは、エンタープライズエージェントシステムにおいて認識およびコンテキスト把握を行うサブエージェントとして設計された、30B-A3Bのオープンマルチモーダルモデルです。テキスト、画像、動画、音声の入力を受け取り、テキストを出力することで、単一の推論ループ内で複数のモダリティを横断した認識と推論を可能にします。ハイブリッドなMoE Transformer-MambaアーキテクチャにConv3Dビデオレイヤーと効率的なビデオサンプリング（EVS）を組み合わせることで、従来の視覚・音声パイプラインを個別に処理する場合と比較して、動画推論におけるスループットを約2倍に向上させ、計算コストを2.5倍削減しました。最大300Kのコンテキスト長と16,384の推論予算をサポートし、推論を通じた拡張思考機能も備えています。

ビジョン深い思考|商用モデル

学習完了日

非公開

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

256KIN66KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

—

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

費用を計算する

AI性能評価

総合

AA Intelligence Index

21%↓18%

推論·数学

GPQA Diamond

47%↓35%

HLE

5.3%↓12%

コーディング

AA Coding Index

15%↓22%

TAU2

45%↓35%

TerminalBench

8.3%↓26%

SciCode

28%↓14%

言語·指示

IFBench

63%↑0%

AA-LCR

36%↓26%

出力速度

標準モード

312tok/s↑235

出力開始 6.96s

出典:Artificial Analysis

NVIDIA