GPT-OSS-120B는 OpenAI 최초의 오픈 가중치 언어 모델로, 총 1,170억 매개변수의 전문가 혼합(MoE) 구조에서 순방향 연산당 51억 개만 활성화합니다. 네이티브 MXFP4 양자화를 통해 80GB GPU 한 장에서 구동 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 달성합니다. 사고 깊이 조절, 전체 사고 사슬 접근, 함수 호출과 구조화된 출력 등 도구 사용을 지원하며, Apache 2.0 라이선스로 공개되어 로컬 환경에서 자유롭게 활용할 수 있습니다.
제공사
출시일
2025-08-05
학습완료일
2024-06-30
라이선스
공개 모델
입출력 형식
처리용량
131K / 131K
API 입출력 (1M)
$0.039 / $0.18
사용 방법
API 연결
출력 속도
86 tok/sArena 종합
1353Intelligence Index
24.5Coding Index
15.5Math Index
66.7LiveBench
46.4ForecastBench
—GPQA Diamond
67.2%HLE
5.2%MMLU-Pro
77.5%AIME 2025
66.7%MATH-500
—LB 추론
39.2LB 수학
68.9LB 데이터 분석
38.8LiveCodeBench
70.7%LB 코딩
60.2LB 에이전틱
16.7TAU2
45.0%TerminalBench
5.3%SciCode
36.0%IFBench
58.3%AA-LCR
0.4환각률 (HHEM)
14.2%사실 일관성 (HHEM)
85.8%LB 언어
48.6LB 지시
50.31 / 3
좌우로 스와이프
GPT-OSS-120B는 OpenAI 최초의 오픈 가중치 언어 모델로, 총 1,170억 매개변수의 전문가 혼합(MoE) 구조에서 순방향 연산당 51억 개만 활성화합니다. 네이티브 MXFP4 양자화를 통해 80GB GPU 한 장에서 구동 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 달성합니다. 사고 깊이 조절, 전체 사고 사슬 접근, 함수 호출과 구조화된 출력 등 도구 사용을 지원하며, Apache 2.0 라이선스로 공개되어 로컬 환경에서 자유롭게 활용할 수 있습니다.
제공사
출시일
2025-08-05
학습완료일
2024-06-30
라이선스
공개 모델
입출력 형식
처리용량
131K / 131K
API 입출력 (1M)
$0.039 / $0.18
사용 방법
API 연결
출력 속도
86 tok/sArena 종합
1353Intelligence Index
24.5Coding Index
15.5Math Index
66.7LiveBench
46.4ForecastBench
—GPQA Diamond
67.2%HLE
5.2%MMLU-Pro
77.5%AIME 2025
66.7%MATH-500
—LB 추론
39.2LB 수학
68.9LB 데이터 분석
38.8LiveCodeBench
70.7%LB 코딩
60.2LB 에이전틱
16.7TAU2
45.0%TerminalBench
5.3%SciCode
36.0%IFBench
58.3%AA-LCR
0.4환각률 (HHEM)
14.2%사실 일관성 (HHEM)
85.8%LB 언어
48.6LB 지시
50.3