DeepSeek V3.2
🧠 AI Модельdeepseek
Высокоэффективная LLM с DeepSeek Sparse Attention для сильного рассуждения и использования инструментов.
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармонизации высокой вычислительной эффективности с сильной производительностью в рассуждениях и агентном использовании инструментов. Она представляет DeepSeek Sparse Attention (DSA) — механизм разреженного внимания с тонкой зернистостью, который оптимизирует вычисления без ущерба для способностей к рассуждению. Это делает её идеальной для продвинутого агентного использования инструментов и решения сложных задач. С контекстной длиной в 131 072 токена и текстовыми модальностями, она балансирует производительность и экономическую эффективность. Она поддерживает различные параметры, включая frequency_penalty, include_reasoning, logit_bias, max_tokens, min_p, presence_penalty, reasoning и repetition_penalty. Результаты бенчмарков включают рейтинги ELO: 1214 в 3D, 1109 в ASCII-арте и 1217 в категориях кода.
💡Основное
- ├─DeepSeek Sparse Attention (DSA)
- ├─Контекстное окно 131K токенов
- └─Вход $0,23/М, выход $0,34/М
🎯Для
- ├─Исследователи ИИ
- ├─разработчики агентных систем
- └─предприятия, ориентированные на экономию