DeepSeek V3.2

🧠 AI Модельdeepseek

Высокоэффективная LLM с DeepSeek Sparse Attention для сильного рассуждения и использования инструментов.

DeepSeek-V3.2 — это большая языковая модель, разработанная для гармонизации высокой вычислительной эффективности с сильной производительностью в рассуждениях и агентном использовании инструментов. Она представляет DeepSeek Sparse Attention (DSA) — механизм разреженного внимания с тонкой зернистостью, который оптимизирует вычисления без ущерба для способностей к рассуждению. Это делает её идеальной для продвинутого агентного использования инструментов и решения сложных задач. С контекстной длиной в 131 072 токена и текстовыми модальностями, она балансирует производительность и экономическую эффективность. Она поддерживает различные параметры, включая frequency_penalty, include_reasoning, logit_bias, max_tokens, min_p, presence_penalty, reasoning и repetition_penalty. Результаты бенчмарков включают рейтинги ELO: 1214 в 3D, 1109 в ASCII-арте и 1217 в категориях кода.

💡Основное

├─DeepSeek Sparse Attention (DSA)
├─Контекстное окно 131K токенов
└─Вход $0,23/М, выход $0,34/М

🎯Для

├─Исследователи ИИ
├─разработчики агентных систем
└─предприятия, ориентированные на экономию

🔗Ссылки

└─Страница модели на OpenRouter