Gemini 2.5 Pro는 Google의 최첨단 추론 모델로, 깊은 분석적 사고가 요구되는 고급 코딩, 수학, 과학 작업에 맞게 설계되었습니다. 내장된 "사고" 기능으로 복잡한 문제를 단계별로 높은 정확도로 추론하며, 출시 시 LMArena 리더보드에서 1위를 달성하여 인간 선호도 정합에서 최고 수준을 입증했습니다. 100만 토큰 컨텍스트 창과 멀티모달 입력을 지원하여 복잡한 문제 해결, 장문 문서 분석, 최고 수준의 추론 깊이가 필요한 연구급 워크플로에 뛰어납니다.
API|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1448
±3집계일 2026-05-01
종합 순위
45위
113,545 투표수
Arena 능력별 점수
한국어 능력
1414±1425위
복잡한 질문
1460±354위
전문 지식
1464±850위
지시 이행
1441±438위
대화 기억
1449±550위
창의력
1447±518위
코딩 실력
1465±578위
수학 능력
1443±742위
Arena 직군별 점수
문학·창작
1448±526위
생활·사회과학
1472±533위
엔터·미디어
1433±530위
경영·금융
1437±556위
의학·보건
1468±847위
법률·행정
1467±732위
소프트웨어·IT
1461±467위
수학·통계
1450±841위
종합
AA Intelligence Index
35%↓5%
LiveBench
57%↓3%
ForecastBench
60%↑1%
추론·수학
AA Math Index
88%↑13%
GPQA Diamond
84%↑2%
HLE
21%↑4%
MMLU-Pro
86%↑5%
AIME 2025
88%↑13%
MATH-500
97%↑4%
LB 추론
71%↑2%
LB 수학
68%↓6%
LB 데이터 분석
52%↓2%
코딩
AA Coding Index
32%↓5%
LiveCodeBench
80%↑15%
LB 코딩
76%↑3%
LB 에이전틱
33%↓12%
TAU2
54%↓26%
TerminalBench
27%↓8%
SciCode
43%↑1%
언어·지시
IFBench
49%↓14%
AA-LCR
66%↑4%
환각률 (HHEM)
7.0%↓3%
사실 일관성 (HHEM)
93%↑3%
LB 언어
76%↑3%
LB 지시
33%↓18%
출력 속도
일반 모드
122tok/s↑45
출력 시작 17.99s
