DeepSeek: DeepSeek V3 0324
🧠 AI 모델deepseek
685B MoE 모델, 163k 컨텍스트, DeepSeek 최신 플래그십
DeepSeek V3 0324는 DeepSeek 팀이 개발한 최첨단 대규모 언어 모델입니다. 총 6850억 개의 파라미터를 가진 혼합 전문가(MoE) 아키텍처를 사용하여 토큰당 일부 파라미터만 활성화함으로써 효율적인 추론이 가능합니다. 이 모델은 이전 버전인 DeepSeek V3의 성공을 바탕으로 채팅 기반 애플리케이션 및 일반 언어 이해에 탁월합니다. 주요 기능으로는 frequency_penalty, logit_bias, max_tokens, min_p, presence_penalty, repetition_penalty, response_format, seed 지원이 있습니다. 벤치마크는 다양한 NLP 작업에서 강력한 성능을 나타내지만 정확한 점수는 제공되지 않습니다. OpenRouter를 통해 경쟁력 있는 가격으로 액세스할 수 있습니다.
💡하이라이트
- ├─685B MoE 아키텍처
- ├─163,840 토큰 컨텍스트
- └─$0.20/$0.77 백만 토큰당
🎯대상
- ├─AI 연구자
- ├─개발자
- └─기술 애호가