Claude Opus 4는 2025년 5월에 출시된 Anthropic의 획기적인 코딩 및 에이전트 모델로, 복잡한 장시간 작업에서 지속적인 성능의 새로운 기준을 세웠습니다. SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 기록하며, 수천 단계의 에이전트 워크플로를 성능 저하 없이 수 시간 동안 연속 처리할 수 있습니다. 하이브리드 모델로서 즉각적인 응답과 깊은 사고를 위한 확장 사고 모드를 모두 지원하며, 병렬 도구 사용과 향상된 지시 기억 능력을 갖추고 있습니다.
제공사
출시일
2025-05-22
학습완료일
2025-05-01
라이선스
상용 모델
입출력 형식
처리용량
1M / 128K
API 입출력 (1M)
$15 / $75
사용 방법
API 연결
출력 속도
34 tok/sArena 종합
1424Intelligence Index
39.0Coding Index
34.0Math Index
73.3LiveBench
—ForecastBench
60.6GPQA Diamond
79.6%HLE
11.7%MMLU-Pro
87.3%AIME 2025
73.3%MATH-500
98.2%LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
63.6%LB 코딩
—LB 에이전틱
—TAU2
73.4%TerminalBench
31.1%SciCode
39.8%IFBench
53.7%AA-LCR
0.3환각률 (HHEM)
12.0%사실 일관성 (HHEM)
88.0%LB 언어
—LB 지시
—1 / 3
좌우로 스와이프
Claude Opus 4는 2025년 5월에 출시된 Anthropic의 획기적인 코딩 및 에이전트 모델로, 복잡한 장시간 작업에서 지속적인 성능의 새로운 기준을 세웠습니다. SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 기록하며, 수천 단계의 에이전트 워크플로를 성능 저하 없이 수 시간 동안 연속 처리할 수 있습니다. 하이브리드 모델로서 즉각적인 응답과 깊은 사고를 위한 확장 사고 모드를 모두 지원하며, 병렬 도구 사용과 향상된 지시 기억 능력을 갖추고 있습니다.
제공사
출시일
2025-05-22
학습완료일
2025-05-01
라이선스
상용 모델
입출력 형식
처리용량
1M / 128K
API 입출력 (1M)
$15 / $75
사용 방법
API 연결
출력 속도
34 tok/sArena 종합
1424Intelligence Index
39.0Coding Index
34.0Math Index
73.3LiveBench
—ForecastBench
60.6GPQA Diamond
79.6%HLE
11.7%MMLU-Pro
87.3%AIME 2025
73.3%MATH-500
98.2%LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
63.6%LB 코딩
—LB 에이전틱
—TAU2
73.4%TerminalBench
31.1%SciCode
39.8%IFBench
53.7%AA-LCR
0.3환각률 (HHEM)
12.0%사실 일관성 (HHEM)
88.0%LB 언어
—LB 지시
—