Qwen3.5 397B A17B
🧠 AI模型qwen
397B参数MoE视觉语言模型,线性注意力,每token仅激活17B参数,256K上下文。
Qwen3.5 397B-A17B模型采用混合架构,结合线性注意力机制与稀疏混合专家(MoE)方法。这一设计在保持高容量的同时降低了计算开销:397B总参数中,每token仅激活17B参数,相比同等规模的密集模型,推理速度更快,内存占用更低。作为原生视觉语言模型,它能处理包括文本、图像和视频在内的多模态输入,并生成文本输出。凭借256,000 token的上下文长度,可处理长文档和多轮对话。基准测试显示其性能强劲,在3D任务、代码类别和数据可视化任务上分别取得ELO 1242、1231和1219的评分。该模型部署在OpenRouter上,支持frequency_penalty、logit_bias、推理标志等多种生成参数。