Gemini 2.5 Flash TTS는 Gemini 2.5 Flash 구조를 기반으로 한 Google의 음성 합성 모델로, 실시간 음성 어시스턴트, 대량 내레이션, 대화형 서비스에 맞게 설계되었습니다. 24개 언어를 지원하며 음성 스타일과 속도를 세밀하게 제어할 수 있고, 다중 화자 시나리오에서도 일관된 캐릭터 음성을 유지합니다. 스타일 프롬프트에 맞춘 향상된 표현력과 맥락 기반 속도 조절을 갖추어, 대화형 음성 에이전트와 동적 오디오 콘텐츠 제작에 적합합니다.
제공사
Google출시일
2025-12-10
학습완료일
미공개
라이선스
상용 모델
입출력 형식
처리용량
8K / 16K
API 입출력 (1M)
—
사용 방법
API 연결
출력 속도
—Arena 종합
—Intelligence Index
—Coding Index
—Math Index
—LiveBench
—ForecastBench
—GPQA Diamond
—HLE
—MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
—LB 코딩
—LB 에이전틱
—TAU2
—TerminalBench
—SciCode
—IFBench
—AA-LCR
—환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
—LB 지시
—1 / 3
좌우로 스와이프
Gemini 2.5 Flash TTS는 Gemini 2.5 Flash 구조를 기반으로 한 Google의 음성 합성 모델로, 실시간 음성 어시스턴트, 대량 내레이션, 대화형 서비스에 맞게 설계되었습니다. 24개 언어를 지원하며 음성 스타일과 속도를 세밀하게 제어할 수 있고, 다중 화자 시나리오에서도 일관된 캐릭터 음성을 유지합니다. 스타일 프롬프트에 맞춘 향상된 표현력과 맥락 기반 속도 조절을 갖추어, 대화형 음성 에이전트와 동적 오디오 콘텐츠 제작에 적합합니다.
제공사
Google출시일
2025-12-10
학습완료일
미공개
라이선스
상용 모델
입출력 형식
처리용량
8K / 16K
API 입출력 (1M)
—
사용 방법
API 연결
출력 속도
—Arena 종합
—Intelligence Index
—Coding Index
—Math Index
—LiveBench
—ForecastBench
—GPQA Diamond
—HLE
—MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
—LB 코딩
—LB 에이전틱
—TAU2
—TerminalBench
—SciCode
—IFBench
—AA-LCR
—환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
—LB 지시
—