NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
🧠 Модель ИИnvidia
Модель рассуждений/чата на 49 млрд параметров, оптимизированная для агентных задач с контекстом 128K.
Llama-3.3-Nemotron-Super-49B-v1.5 — это трансформерная модель с 49 миллиардами параметров, построенная на архитектуре Meta Llama-3.3-70B-Instruct. NVIDIA применила дополнительное пост-обучение для улучшения способностей в агентных задачах, таких как генерация с дополнением извлечения (RAG) и структурированный вызов инструментов. Модель использует контролируемую тонкую настройку (SFT) на разнообразных наборах данных, охватывающих математику, код и научные рассуждения. С родной длиной контекста 128K (расширенной до 131 072 токенов на OpenRouter) она поддерживает продвинутые функции, такие как режимы рассуждений, штрафы частоты и присутствия, смещение logit и контроль повторений. Модель выводит только текст и оптимизирована для взаимодействия на английском языке. Ценообразование симметрично: $0.40 за миллион входных и выходных токенов, что делает её экономически эффективной для высокообъёмных агентных развёртываний.
💡Основное
- ├─49 млрд параметров, контекст 128K
- ├─Дообучена для агентных задач (RAG, вызов инструментов)
- └─$0.40/M токенов (ввод и вывод)
🎯Для
- ├─Разработчики ИИ
- ├─исследователи агентного ИИ
- └─корпоративные NLP-команды