NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

🧠 Модель ИИnvidia

Модель рассуждений/чата на 49 млрд параметров, оптимизированная для агентных задач с контекстом 128K.

Llama-3.3-Nemotron-Super-49B-v1.5 — это трансформерная модель с 49 миллиардами параметров, построенная на архитектуре Meta Llama-3.3-70B-Instruct. NVIDIA применила дополнительное пост-обучение для улучшения способностей в агентных задачах, таких как генерация с дополнением извлечения (RAG) и структурированный вызов инструментов. Модель использует контролируемую тонкую настройку (SFT) на разнообразных наборах данных, охватывающих математику, код и научные рассуждения. С родной длиной контекста 128K (расширенной до 131 072 токенов на OpenRouter) она поддерживает продвинутые функции, такие как режимы рассуждений, штрафы частоты и присутствия, смещение logit и контроль повторений. Модель выводит только текст и оптимизирована для взаимодействия на английском языке. Ценообразование симметрично: $0.40 за миллион входных и выходных токенов, что делает её экономически эффективной для высокообъёмных агентных развёртываний.

💡Основное

├─49 млрд параметров, контекст 128K
├─Дообучена для агентных задач (RAG, вызов инструментов)
└─$0.40/M токенов (ввод и вывод)

🎯Для

├─Разработчики ИИ
├─исследователи агентного ИИ
└─корпоративные NLP-команды

🔗Ссылки

└─Страница OpenRouter