Qwen: Qwen3.5-Flash

🧠 AI模型qwen

混合注意力+MoE模型，1M上下文，高效推理。

Qwen3.5原生视觉语言Flash模型采用混合架构，集成了线性注意力机制和稀疏混合专家（MoE）模型，与传统Transformer相比实现了更高的推理效率。这种设计降低了计算复杂度，同时保持多模态任务的高性能。模型支持1,000,000 token的上下文长度，能够处理长文档或视频。输入模态包括文本、图像和视频，输出为文本。价格：输入$0.07/M token，输出$0.26/M token。提供结构化输出、推理和种子控制等功能。

💡核心亮点

├─混合线性注意力+MoE
├─1M token上下文窗口
└─文本、图像、视频输入

🎯适用人群

├─AI研究人员
├─开发者
└─企业用户

🔗链接

└─OpenRouter页面