Nemotron 3 Super는 총 1,200억 매개변수에서 120억만 활성화하는 NVIDIA의 오픈 하이브리드 Mamba-Transformer MoE 모델입니다. Mamba 계층의 시퀀스 효율과 Transformer 계층의 정밀 추론을 결합한 하이브리드 구조로, 이전 세대 대비 5배 이상의 처리량을 달성합니다. Blackwell GPU에 최적화된 NVFP4 정밀도와 네이티브 100만 토큰 컨텍스트 창을 갖추고, PinchBench에서 85.6%로 오픈 모델 최고 점수를 기록하여 복잡한 다중 에이전트 활용, 소프트웨어 개발, 에이전트형 추론에 적합합니다.
심층 사고|공개 모델
출처:공식 문서
AI 성능 평가
Arena 종합 점수
1361
±7집계일 2026-05-01
종합 순위
151위
7,409 투표수
Arena 능력별 점수
복잡한 질문
1380±9149위
전문 지식
1398±24127위
지시 이행
1347±13154위
대화 기억
1349±17156위
창의력
1302±18182위
코딩 실력
1409±14149위
수학 능력
1379±25137위
Arena 직군별 점수
문학·창작
1324±15168위
생활·사회과학
1366±17163위
엔터·미디어
1317±17160위
경영·금융
1350±16164위
의학·보건
1350±26175위
법률·행정
1368±26158위
소프트웨어·IT
1404±11146위
수학·통계
1398±27116위
종합
AA Intelligence Index
36%↓3%
LiveBench
32%↓29%
추론·수학
GPQA Diamond
80%↓2%
HLE
19%↑2%
LB 추론
34%↓35%
LB 수학
36%↓38%
LB 데이터 분석
21%↓32%
코딩
AA Coding Index
31%↓5%
LB 코딩
54%↓19%
LB 에이전틱
23%↓22%
TAU2
68%↓13%
TerminalBench
29%↓5%
SciCode
36%↓6%
언어·지시
IFBench
72%↑8%
AA-LCR
60%↓2%
LB 언어
30%↓42%
LB 지시
28%↓23%
출력 속도
일반 모드
80tok/s↑2
출력 시작 1.88s
추론 모드
189tok/s↑102
출력 시작 11.59s