GPT-4o Transcribe는 OpenAI의 고급 음성 인식 모델로, GPT-4o 구조를 기반으로 최대한의 전사 정확도를 제공합니다. Whisper와 GPT-4o Mini Transcribe 대비 더 낮은 단어 오류율과 우수한 언어 인식 성능을 갖추어 높은 정확도가 요구되는 전사 작업에 최적입니다. 웹소켓을 통한 실시간 오디오 스트리밍, 전문 용어를 위한 문맥 프롬프트, 신뢰도 평가를 위한 로그 확률 출력을 지원합니다.
제공사
출시일
2024-06-01
학습완료일
2024-06-01
라이선스
상용 모델
입출력 형식
처리용량
—
API 입출력 (1M)
$2.5 / $10
사용 방법
API 연결
출력 속도
31 tok/sArena 종합
—Intelligence Index
—Coding Index
—Math Index
—LiveBench
—ForecastBench
—GPQA Diamond
—HLE
—MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
—LB 코딩
—LB 에이전틱
—TAU2
—TerminalBench
—SciCode
—IFBench
—AA-LCR
—환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
—LB 지시
—1 / 3
좌우로 스와이프
GPT-4o Transcribe는 OpenAI의 고급 음성 인식 모델로, GPT-4o 구조를 기반으로 최대한의 전사 정확도를 제공합니다. Whisper와 GPT-4o Mini Transcribe 대비 더 낮은 단어 오류율과 우수한 언어 인식 성능을 갖추어 높은 정확도가 요구되는 전사 작업에 최적입니다. 웹소켓을 통한 실시간 오디오 스트리밍, 전문 용어를 위한 문맥 프롬프트, 신뢰도 평가를 위한 로그 확률 출력을 지원합니다.
제공사
출시일
2024-06-01
학습완료일
2024-06-01
라이선스
상용 모델
입출력 형식
처리용량
—
API 입출력 (1M)
$2.5 / $10
사용 방법
API 연결
출력 속도
31 tok/sArena 종합
—Intelligence Index
—Coding Index
—Math Index
—LiveBench
—ForecastBench
—GPQA Diamond
—HLE
—MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
—LB 코딩
—LB 에이전틱
—TAU2
—TerminalBench
—SciCode
—IFBench
—AA-LCR
—환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
—LB 지시
—