OpenAI
OpenAI

GPT OSS 120B

2025-08-05

GPT-OSS-120B는 OpenAI 최초의 오픈 가중치 언어 모델로, 총 1,170억 매개변수의 전문가 혼합(MoE) 구조에서 순방향 연산당 51억 개만 활성화합니다. 네이티브 MXFP4 양자화를 통해 80GB GPU 한 장에서 구동 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 달성합니다. 사고 깊이 조절, 전체 사고 사슬 접근, 함수 호출과 구조화된 출력 등 도구 사용을 지원하며, Apache 2.0 라이선스로 공개되어 로컬 환경에서 자유롭게 활용할 수 있습니다.

API|심층 사고|공개 모델Apache 2.0
학습 완료일
2024-06-30
입력 형식 → 출력 형식
처리용량
131KIN131KOUT
개별 비용(백만 글자)
$0.039IN$0.18OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1353
±4
집계일 2026-05-01
종합 순위
160위
30,670 투표수
Arena 능력별 점수
한국어 능력
1263±25152위
복잡한 질문
1362±6165위
전문 지식
1360±17156위
지시 이행
1326±7172위
대화 기억
1328±9180위
창의력
1279±10212위
코딩 실력
1390±8163위
수학 능력
1383±14133위
Arena 직군별 점수
문학·창작
1310±8186위
생활·사회과학
1361±9169위
엔터·미디어
1287±8193위
경영·금융
1350±8163위
의학·보건
1369±15159위
법률·행정
1345±14179위
소프트웨어·IT
1386±6162위
수학·통계
1384±15134위
종합
AA Intelligence Index
25%↓15%
LiveBench
46%↓14%
추론·수학
AA Math Index
67%↓8%
GPQA Diamond
67%↓15%
HLE
5.2%↓12%
MMLU-Pro
78%↓4%
AIME 2025
67%↓8%
LB 추론
39%↓30%
LB 수학
69%↓5%
LB 데이터 분석
39%↓14%
코딩
AA Coding Index
16%↓21%
LiveCodeBench
71%↑5%
LB 코딩
60%↓13%
LB 에이전틱
17%↓28%
TAU2
45%↓35%
TerminalBench
5.3%↓29%
SciCode
36%↓6%
언어·지시
IFBench
58%↓5%
AA-LCR
44%↓18%
환각률 (HHEM)
14%↑4%
사실 일관성 (HHEM)
86%↓4%
LB 언어
49%↓24%
LB 지시
50%↓1%
출력 속도
일반 모드
86tok/s↑9
출력 시작 0.48s
추론 모드
233tok/s↑146
출력 시작 9.09s