GLM 4.5V
🧠 AI 모델z-ai
106B MoE 비전-언어 모델, 12B 활성화, 멀티모달 에이전트 애플리케이션용.
GLM-4.5V는 Mixture-of-Experts (MoE) 아키텍처를 활용하여 총 1,060억 개의 파라미터 중 토큰당 120억 개만 활성화되어 효율적인 추론이 가능합니다. 65,536 토큰의 컨텍스트 길이를 지원하며, 입력 토큰 100만 개당 $0.60, 출력 토큰 100만 개당 $1.80의 가격을 제공합니다. 이 모델은 Video-MME와 같은 벤치마크에서의 성능으로 입증된 비디오 이해에 탁월합니다. 추론, 함수 호출, 구조화된 출력을 허용하는 멀티모달 에이전트 애플리케이션에 최적화되었습니다. 주요 기능으로 frequency_penalty, max_tokens, response_format, seed, reasoning 지원이 포함됩니다.
💡하이라이트
- ├─106B MoE, 12B만 활성화
- ├─65K 컨텍스트 윈도우
- └─최첨단 비디오 이해
🎯대상
- ├─AI 연구자
- ├─멀티모달 에이전트 개발자
- └─비전-언어 엔지니어