AI 모델 비교

Claude Opus 4는 2025년 5월에 출시된 Anthropic의 획기적인 코딩 및 에이전트 모델로, 복잡한 장시간 작업에서 지속적인 성능의 새로운 기준을 세웠습니다. SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 기록하며, 수천 단계의 에이전트 워크플로를 성능 저하 없이 수 시간 동안 연속 처리할 수 있습니다. 하이브리드 모델로서 즉각적인 응답과 깊은 사고를 위한 확장 사고 모드를 모두 지원하며, 병렬 도구 사용과 향상된 지시 기억 능력을 갖추고 있습니다.

제공사

Anthropic

출시일

2025-05-22

학습완료일

2025-05-01

라이선스

상용 모델

입출력 형식

처리용량

1M / 128K

API 입출력 (1M)

$15 / $75

사용 방법

API 연결

출력 속도

34 tok/s

Arena 종합

1424

Intelligence Index

39.0

Coding Index

34.0

Math Index

73.3

LiveBench

—

ForecastBench

60.6

GPQA Diamond

79.6%

HLE

11.7%

MMLU-Pro

87.3%

AIME 2025

73.3%

MATH-500

98.2%

LB 추론

—

LB 수학

—

LB 데이터 분석

—

LiveCodeBench

63.6%

LB 코딩

—

LB 에이전틱

—

TAU2

73.4%

TerminalBench

31.1%

SciCode

39.8%

IFBench

53.7%

AA-LCR

0.3

환각률 (HHEM)

12.0%

사실 일관성 (HHEM)

88.0%

LB 언어

—

LB 지시

—

비용 계산하기 AI 모델 상세 페이지

1 / 3

좌우로 스와이프

제공사