Gemma 4 26B A4B
🧠 AI模型google
仅3.8B活跃参数即可达到接近31B模型的质量,支持262K上下文和多模态输入。
Gemma 4 26B A4B IT是Google DeepMind为效率优化的稀疏MoE模型。总参数25.2B,每token仅激活3.8B,性能可与更稠密的31B模型媲美,同时大幅降低计算成本。拥有262K token的上下文窗口,支持长文本推理与分析。模型支持多模态输入(图像、文本、视频)并生成文本输出。关键特性包括频率惩罚、logprobs、logit bias、推理token和min_p采样。基准测试显示其在语言、编码和多模态任务上表现强劲,适用于广泛的AI应用,成本适中。