Gemini 2.5 Flash는 Google의 주력 추론 모델로, 코딩, 수학, 과학 작업에서 빠르고 높은 품질의 응답을 제공합니다. 설정 가능한 사고 수준을 갖춘 내장 "사고" 기능으로 작업 복잡도에 따라 응답 속도와 추론 깊이를 유연하게 조절할 수 있습니다. 텍스트, 이미지, 오디오, 동영상, PDF를 포함한 멀티모달 입력과 100만 토큰 컨텍스트 창을 지원하며, 대형 Gemini Pro 모델의 일부 비용과 지연 시간으로 뛰어난 성능을 제공합니다.
API|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1411
±3집계일 2026-05-01
종합 순위
95위
113,223 투표수
Arena 능력별 점수
한국어 능력
1378±1556위
복잡한 질문
1420±3107위
전문 지식
1427±895위
지시 이행
1402±488위
대화 기억
1404±5108위
창의력
1397±567위
코딩 실력
1424±5137위
수학 능력
1407±795위
Arena 직군별 점수
문학·창작
1405±472위
생활·사회과학
1430±592위
엔터·미디어
1389±582위
경영·금융
1397±5111위
의학·보건
1426±8106위
법률·행정
1428±779위
소프트웨어·IT
1422±4126위
수학·통계
1419±887위
종합
AA Intelligence Index
27%↓12%
LiveBench
47%↓14%
ForecastBench
59%↓1%
추론·수학
AA Math Index
73%↓1%
GPQA Diamond
79%↓3%
HLE
11%↓6%
MMLU-Pro
83%↑2%
AIME 2025
73%↓1%
MATH-500
98%↑5%
LB 추론
45%↓24%
LB 수학
69%↓5%
LB 데이터 분석
47%↓6%
코딩
AA Coding Index
22%↓14%
LiveCodeBench
70%↑4%
LB 코딩
66%↓7%
LB 에이전틱
17%↓28%
TAU2
32%↓49%
TerminalBench
14%↓20%
SciCode
39%↓2%
언어·지시
IFBench
50%↓13%
AA-LCR
62%↑0%
환각률 (HHEM)
7.8%↓2%
사실 일관성 (HHEM)
92%↑2%
LB 언어
62%↓10%
LB 지시
29%↓22%
출력 속도
일반 모드
213tok/s↑135
출력 시작 0.44s
추론 모드
210tok/s↑123
출력 시작 14.08s
