Gemma 4 31B는 Google DeepMind의 가장 강력한 오픈 가중치 모델로, Apache 2.0 라이선스로 공개된 307억 매개변수의 조밀 멀티모달 모델입니다. 256K 토큰 컨텍스트 창에서 텍스트와 이미지 입력을 처리하며, 설정 가능한 사고/추론 모드, 네이티브 함수 호출, 구조화된 JSON 출력, 140개 이상의 언어를 지원합니다. Arena AI 리더보드에서 세계 오픈 모델 상위 3위에 올라 있으며, 수학, 코딩, 에이전트 도구 활용에서 Llama 4, Qwen 3.5 등 대형 모델에 견주는 성능을 발휘하고, 24GB 그래픽 메모리의 소비자용 GPU에서도 양자화 실행이 가능합니다.
API|비전심층 사고|공개 모델Apache 2.0
AI 성능 평가
Arena 종합 점수
1451
±8집계일 2026-05-01
종합 순위
38위
5,810 투표수
Arena 능력별 점수
복잡한 질문
1473±1041위
전문 지식
1480±2734위
지시 이행
1453±1429위
대화 기억
1462±1839위
창의력
1423±1942위
코딩 실력
1498±1639위
수학 능력
1468±2823위
Arena 직군별 점수
문학·창작
1433±1639위
생활·사회과학
1464±2043위
엔터·미디어
1416±1848위
경영·금융
1443±1750위
의학·보건
1464±2856위
법률·행정
1466±2733위
소프트웨어·IT
1490±1237위
수학·통계
1471±3122위
종합
AA Intelligence Index
39%↑0%
LiveBench
62%↑2%
추론·수학
GPQA Diamond
86%↑4%
HLE
23%↑5%
LB 추론
59%↓10%
LB 수학
74%↑0%
LB 데이터 분석
59%↑6%
코딩
AA Coding Index
39%↑2%
LB 코딩
60%↓13%
LB 에이전틱
40%↓5%
TAU2
60%↓21%
TerminalBench
36%↑2%
SciCode
43%↑2%
언어·지시
IFBench
76%↑12%
AA-LCR
62%↑0%
환각률 (HHEM)
7.4%↓3%
사실 일관성 (HHEM)
93%↑3%
LB 언어
71%↓1%
LB 지시
68%↑17%
출력 속도
일반 모드
14tok/s↓64
출력 시작 1.21s
추론 모드
35tok/s↓52
출력 시작 58.23s
