Gemma 4 31B는 Google DeepMind의 가장 강력한 오픈 가중치 모델로, Apache 2.0 라이선스로 공개된 307억 매개변수의 조밀 멀티모달 모델입니다. 256K 토큰 컨텍스트 창에서 텍스트와 이미지 입력을 처리하며, 설정 가능한 사고/추론 모드, 네이티브 함수 호출, 구조화된 JSON 출력, 140개 이상의 언어를 지원합니다. Arena AI 리더보드에서 세계 오픈 모델 상위 3위에 올라 있으며, 수학, 코딩, 에이전트 도구 활용에서 Llama 4, Qwen 3.5 등 대형 모델에 견주는 성능을 발휘하고, 24GB 그래픽 메모리의 소비자용 GPU에서도 양자화 실행이 가능합니다.
제공사
Google출시일
2026-04-02
학습완료일
2025-01-01
라이선스
공개 모델
입출력 형식
처리용량
262K / 131K
API 입출력 (1M)
$0.13 / $0.38
사용 방법
API 연결
출력 속도
14 tok/sArena 종합
1451Intelligence Index
39.2Coding Index
38.7Math Index
—LiveBench
62.4ForecastBench
—GPQA Diamond
85.7%HLE
22.7%MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
59.4LB 수학
73.9LB 데이터 분석
58.8LiveCodeBench
—LB 코딩
60.3LB 에이전틱
40.0TAU2
59.9%TerminalBench
36.4%SciCode
43.4%IFBench
75.6%AA-LCR
0.6환각률 (HHEM)
7.4%사실 일관성 (HHEM)
92.6%LB 언어
71.3LB 지시
67.61 / 3
좌우로 스와이프
Gemma 4 31B는 Google DeepMind의 가장 강력한 오픈 가중치 모델로, Apache 2.0 라이선스로 공개된 307억 매개변수의 조밀 멀티모달 모델입니다. 256K 토큰 컨텍스트 창에서 텍스트와 이미지 입력을 처리하며, 설정 가능한 사고/추론 모드, 네이티브 함수 호출, 구조화된 JSON 출력, 140개 이상의 언어를 지원합니다. Arena AI 리더보드에서 세계 오픈 모델 상위 3위에 올라 있으며, 수학, 코딩, 에이전트 도구 활용에서 Llama 4, Qwen 3.5 등 대형 모델에 견주는 성능을 발휘하고, 24GB 그래픽 메모리의 소비자용 GPU에서도 양자화 실행이 가능합니다.
제공사
Google출시일
2026-04-02
학습완료일
2025-01-01
라이선스
공개 모델
입출력 형식
처리용량
262K / 131K
API 입출력 (1M)
$0.13 / $0.38
사용 방법
API 연결
출력 속도
14 tok/sArena 종합
1451Intelligence Index
39.2Coding Index
38.7Math Index
—LiveBench
62.4ForecastBench
—GPQA Diamond
85.7%HLE
22.7%MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
59.4LB 수학
73.9LB 데이터 분석
58.8LiveCodeBench
—LB 코딩
60.3LB 에이전틱
40.0TAU2
59.9%TerminalBench
36.4%SciCode
43.4%IFBench
75.6%AA-LCR
0.6환각률 (HHEM)
7.4%사실 일관성 (HHEM)
92.6%LB 언어
71.3LB 지시
67.6