Nemotron 3 Super는 총 1,200억 매개변수에서 120억만 활성화하는 NVIDIA의 오픈 하이브리드 Mamba-Transformer MoE 모델입니다. Mamba 계층의 시퀀스 효율과 Transformer 계층의 정밀 추론을 결합한 하이브리드 구조로, 이전 세대 대비 5배 이상의 처리량을 달성합니다. Blackwell GPU에 최적화된 NVFP4 정밀도와 네이티브 100만 토큰 컨텍스트 창을 갖추고, PinchBench에서 85.6%로 오픈 모델 최고 점수를 기록하여 복잡한 다중 에이전트 활용, 소프트웨어 개발, 에이전트형 추론에 적합합니다.
제공사
출시일
2026-03-11
학습완료일
2026-02-01
라이선스
공개 모델
입출력 형식
처리용량
262K / 1M
API 입출력 (1M)
$0.09 / $0.45
사용 방법
—
출력 속도
80 tok/sArena 종합
1361Intelligence Index
36.0Coding Index
31.2Math Index
—LiveBench
32.0ForecastBench
—GPQA Diamond
80.0%HLE
19.2%MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
34.4LB 수학
36.4LB 데이터 분석
21.2LiveCodeBench
—LB 코딩
54.1LB 에이전틱
23.0TAU2
67.8%TerminalBench
28.8%SciCode
36.0%IFBench
71.5%AA-LCR
0.6환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
30.0LB 지시
28.41 / 3
좌우로 스와이프
Nemotron 3 Super는 총 1,200억 매개변수에서 120억만 활성화하는 NVIDIA의 오픈 하이브리드 Mamba-Transformer MoE 모델입니다. Mamba 계층의 시퀀스 효율과 Transformer 계층의 정밀 추론을 결합한 하이브리드 구조로, 이전 세대 대비 5배 이상의 처리량을 달성합니다. Blackwell GPU에 최적화된 NVFP4 정밀도와 네이티브 100만 토큰 컨텍스트 창을 갖추고, PinchBench에서 85.6%로 오픈 모델 최고 점수를 기록하여 복잡한 다중 에이전트 활용, 소프트웨어 개발, 에이전트형 추론에 적합합니다.
제공사
출시일
2026-03-11
학습완료일
2026-02-01
라이선스
공개 모델
입출력 형식
처리용량
262K / 1M
API 입출력 (1M)
$0.09 / $0.45
사용 방법
—
출력 속도
80 tok/sArena 종합
1361Intelligence Index
36.0Coding Index
31.2Math Index
—LiveBench
32.0ForecastBench
—GPQA Diamond
80.0%HLE
19.2%MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
34.4LB 수학
36.4LB 데이터 분석
21.2LiveCodeBench
—LB 코딩
54.1LB 에이전틱
23.0TAU2
67.8%TerminalBench
28.8%SciCode
36.0%IFBench
71.5%AA-LCR
0.6환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
30.0LB 지시
28.4