Claude Opus 4.5는 2025년 11월에 출시된 Anthropic의 프론티어 추론 모델로, 복잡한 소프트웨어 엔지니어링, 에이전트 워크플로, 장기 컴퓨터 활용에 최적화되어 있습니다. 강력한 멀티모달 기능, 프롬프트 주입에 대한 향상된 견고성, 작업에 따라 속도·깊이·토큰 사용량을 조절할 수 있는 새로운 강도 매개변수를 제공합니다. 자율 연구, 다단계 디버깅, 스프레드시트와 브라우저 조작, 다중 에이전트 조율에 뛰어나며, 구조화된 추론과 실행 신뢰성에서 대폭 향상되었습니다.
Anthropic ProAnthropic Max (5x)Anthropic Max (20x)API|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1473
±4집계일 2026-05-01
종합 순위
17위
37,158 투표수
Arena 능력별 점수
한국어 능력
1404±2634위
복잡한 질문
1499±510위
전문 지식
1504±1311위
지시 이행
1485±76위
대화 기억
1487±812위
창의력
1468±97위
코딩 실력
1531±75위
수학 능력
1470±1218위
Arena 직군별 점수
문학·창작
1465±710위
생활·사회과학
1488±815위
엔터·미디어
1456±89위
경영·금융
1468±821위
의학·보건
1488±1319위
법률·행정
1486±1215위
소프트웨어·IT
1513±69위
수학·통계
1470±1523위
종합
AA Intelligence Index
50%↑11%
LiveBench
54%↓7%
ForecastBench
60%↑1%
추론·수학
AA Math Index
91%↑17%
GPQA Diamond
87%↑4%
HLE
28%↑11%
MMLU-Pro
90%↑8%
AIME 2025
91%↑17%
LB 추론
48%↓21%
LB 수학
64%↓10%
LB 데이터 분석
44%↓9%
코딩
AA Coding Index
48%↑11%
LiveCodeBench
87%↑22%
LB 코딩
78%↑5%
LB 에이전틱
50%↑5%
TAU2
90%↑9%
TerminalBench
47%↑13%
SciCode
50%↑8%
언어·지시
IFBench
58%↓5%
AA-LCR
74%↑12%
환각률 (HHEM)
11%↑1%
사실 일관성 (HHEM)
89%↓1%
LB 언어
77%↑5%
LB 지시
29%↓22%
출력 속도
일반 모드
51tok/s↓26
출력 시작 1.21s
추론 모드
58tok/s↓28
출력 시작 13.53s