Qwen: Qwen3.5-Flash
🧠 AI模型qwen
混合注意力+MoE模型,1M上下文,高效推理。
Qwen3.5原生视觉语言Flash模型采用混合架构,集成了线性注意力机制和稀疏混合专家(MoE)模型,与传统Transformer相比实现了更高的推理效率。这种设计降低了计算复杂度,同时保持多模态任务的高性能。模型支持1,000,000 token的上下文长度,能够处理长文档或视频。输入模态包括文本、图像和视频,输出为文本。价格:输入$0.07/M token,输出$0.26/M token。提供结构化输出、推理和种子控制等功能。