Nemotron 3 Nano 30B A3B
🧠 AI 模型nvidia
免费30B MoE模型,256K上下文,每token仅激活3B参数。
Nemotron 3 Nano 30B A3B 是一款小型MoE语言模型,优化了计算效率和准确性,帮助开发者构建专门的代理AI系统。模型采用混合专家架构,总参数量30B,但每token仅激活3B,大幅降低推理成本同时保持强大性能。支持256,000 token的上下文长度,适用于长文档推理和复杂代理工作流。该模型在OpenRouter上免费提供,并支持推理、工具调用、温度参数和top-p采样。尽管未提供具体基准,预计在需要高效设备端或无服务器部署的任务中表现出色。