Kimi K2.5는 2026년 1월에 출시된 Moonshot AI의 네이티브 멀티모달 모델로, 최고 수준의 시각적 코딩 능력과 자기 주도형 에이전트 군집 패러다임을 제공합니다. Kimi K2 기반 위에 약 15조 개의 시각·텍스트 혼합 토큰으로 지속 사전 훈련되어, UI 디자인과 영상 워크플로 같은 시각적 사양에서 코드를 생성합니다. 에이전트 군집 기술은 최대 100개의 병렬 하위 에이전트를 자율 조율하여 각각 독립적으로 검색, 생성, 분석, 정리 작업을 수행하며, 복잡한 연구·작문 작업의 실행 시간을 최대 4.5배 단축합니다.
API|비전심층 사고|공개 모델Modified MIT
AI 성능 평가
Arena 종합 점수
1450
±4집계일 2026-05-01
종합 순위
40위
26,123 투표수
Arena 능력별 점수
한국어 능력
1397±2938위
복잡한 질문
1471±542위
전문 지식
1486±1428위
지시 이행
1438±740위
대화 기억
1452±946위
창의력
1415±1048위
코딩 실력
1507±830위
수학 능력
1474±1417위
Arena 직군별 점수
문학·창작
1424±849위
생활·사회과학
1469±937위
엔터·미디어
1421±942위
경영·금융
1436±957위
의학·보건
1465±1453위
법률·행정
1444±1362위
소프트웨어·IT
1492±632위
수학·통계
1480±1615위
종합
AA Intelligence Index
47%↑8%
LiveBench
69%↑8%
추론·수학
GPQA Diamond
88%↑6%
HLE
29%↑12%
LB 추론
76%↑7%
LB 수학
85%↑11%
LB 데이터 분석
61%↑8%
코딩
AA Coding Index
40%↑3%
LB 코딩
78%↑5%
LB 에이전틱
48%↑3%
TAU2
96%↑15%
TerminalBench
35%↑1%
SciCode
49%↑7%
언어·지시
IFBench
70%↑7%
AA-LCR
65%↑3%
환각률 (HHEM)
14%↑4%
사실 일관성 (HHEM)
86%↓4%
LB 언어
78%↑5%
LB 지시
57%↑6%
출력 속도
일반 모드
48tok/s↓30
출력 시작 1.26s
추론 모드
46tok/s↓41
출력 시작 66.42s