Mistral: Mistral Large 3 2512
🧠 AI模型mistralai
Mistral旗舰MoE模型:675B总量,41B激活,Apache 2.0许可,262K上下文
Mistral Large 3 2512是由Mistral AI开发的最先进语言模型,采用稀疏混合专家(MoE)架构。总参数6750亿,但每次前向传播仅激活410亿参数,在出色性能与计算效率之间取得平衡。支持文本、图像和文件(如PDF)输入,输出文本。模型支持结构化输出、频率/存在惩罚、基于种子的可重复性等高级功能。在基准测试中取得有竞争力成绩(如3D ELO 1180,代码类别ELO 1194),并在宽松的Apache 2.0许可证下发布,便于研究和商业应用广泛使用。