LongCat Flash Chat은 메이퇀이 개발한 총 5,600억 매개변수의 대규모 전문가 혼합(MoE) 모델로, 맥락에 따라 186억~313억(평균 약 270억) 매개변수를 동적으로 활성화합니다. 단축 연결 MoE 설계로 추론 시 초당 100토큰 이상의 처리 속도를 달성하며, 128K 토큰 컨텍스트 창을 지원합니다. 추론, 코딩, 지시 따르기에서 뛰어난 성능을 보이며, 특히 에이전트 작업과 복잡한 다단계 도구 활용 상호작용에서 탁월한 강점을 발휘합니다.
제공사
출시일
2025-09-09
학습완료일
2025-03-31
라이선스
공개 모델
입출력 형식
처리용량
131K / 131K
API 입출력 (1M)
$0.2 / $0.8
사용 방법
—
출력 속도
144 tok/sArena 종합
1434Intelligence Index
23.9Coding Index
16.5Math Index
—LiveBench
—ForecastBench
—GPQA Diamond
63.6%HLE
6.0%MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
—LB 코딩
—LB 에이전틱
—TAU2
79.5%TerminalBench
10.6%SciCode
28.4%IFBench
43.1%AA-LCR
0.3환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
—LB 지시
—1 / 3
좌우로 스와이프
LongCat Flash Chat은 메이퇀이 개발한 총 5,600억 매개변수의 대규모 전문가 혼합(MoE) 모델로, 맥락에 따라 186억~313억(평균 약 270억) 매개변수를 동적으로 활성화합니다. 단축 연결 MoE 설계로 추론 시 초당 100토큰 이상의 처리 속도를 달성하며, 128K 토큰 컨텍스트 창을 지원합니다. 추론, 코딩, 지시 따르기에서 뛰어난 성능을 보이며, 특히 에이전트 작업과 복잡한 다단계 도구 활용 상호작용에서 탁월한 강점을 발휘합니다.
제공사
출시일
2025-09-09
학습완료일
2025-03-31
라이선스
공개 모델
입출력 형식
처리용량
131K / 131K
API 입출력 (1M)
$0.2 / $0.8
사용 방법
—
출력 속도
144 tok/sArena 종합
1434Intelligence Index
23.9Coding Index
16.5Math Index
—LiveBench
—ForecastBench
—GPQA Diamond
63.6%HLE
6.0%MMLU-Pro
—AIME 2025
—MATH-500
—LB 추론
—LB 수학
—LB 데이터 분석
—LiveCodeBench
—LB 코딩
—LB 에이전틱
—TAU2
79.5%TerminalBench
10.6%SciCode
28.4%IFBench
43.1%AA-LCR
0.3환각률 (HHEM)
—사실 일관성 (HHEM)
—LB 언어
—LB 지시
—