Qwen3.5 397B A17B

🧠 AI模型qwen

397B参数MoE视觉语言模型，线性注意力，每token仅激活17B参数，256K上下文。

Qwen3.5 397B-A17B模型采用混合架构，结合线性注意力机制与稀疏混合专家（MoE）方法。这一设计在保持高容量的同时降低了计算开销：397B总参数中，每token仅激活17B参数，相比同等规模的密集模型，推理速度更快，内存占用更低。作为原生视觉语言模型，它能处理包括文本、图像和视频在内的多模态输入，并生成文本输出。凭借256,000 token的上下文长度，可处理长文档和多轮对话。基准测试显示其性能强劲，在3D任务、代码类别和数据可视化任务上分别取得ELO 1242、1231和1219的评分。该模型部署在OpenRouter上，支持frequency_penalty、logit_bias、推理标志等多种生成参数。

💡核心亮点

├─397B MoE，仅激活17B
├─多模态：文本、图像、视频
└─256K上下文长度

🎯适用人群

├─AI研究人员
├─开发者
└─企业

🔗链接

└─在OpenRouter上查看