DeepSeek: R1 0528
🧠 AI模型deepseek
开源大型语言模型更新版,671B MoE仅37B活跃,性能堪比o1。
DeepSeek R1 0528是DeepSeek R1模型的改进版,于2025年5月28日发布。它是一个混合专家(MoE)Transformer,总参数6710亿,每token仅激活370亿,实现高效推理。模型旨在与OpenAI的o1在推理任务中竞争,并完全开源,包括模型权重和推理过程中生成的推理token。它仅处理文本输入输出,拥有163,840 tokens的庞大上下文窗口。定价为每百万输入token 0.50美元,每百万输出token 2.15美元。主要特性包括频率惩罚、logit bias、min_p采样和重复惩罚。在OpenRouter排行榜上,其ELO为1192(总排名第46),在代码(1191)和数据可视化(1222)基准上表现强劲。
💡核心亮点
- ├─671B MoE,每token仅37B活跃
- ├─模型与推理token完全开源开放
- └─163,840 tokens超长上下文窗口
🎯适用人群
- ├─AI研究人员
- ├─开发者
- └─开源爱好者