DeepSeek: DeepSeek V3
🧠 AIモデルdeepseek
DeepSeekの最新MoEモデル、15Tトークンで事前学習、優れたコーディング性能。
DeepSeek-V3はDeepSeekの大規模言語モデルの最新版で、先行モデルの強みを基に指示追従とコーディング能力を強化しています。Mixture-of-Expertsアーキテクチャを採用し、パラメータの一部のみをトークンごとに活性化することで効率を向上。約15兆トークンの多様なコーパスで事前学習され、コーディング(コードカテゴリでELO 1160)やデータ可視化(ELO 1142)など各種ベンチマークで高い性能を発揮。131,072トークンのコンテキスト長により長文処理が可能。OpenRouter経由で透明な価格設定(入力$0.20/M、出力$0.80/M)でアクセスでき、frequency penalty、logit bias、max_tokens、min_p、presence_penalty、repetition_penalty、response_format、seedなどの調整可能パラメータを提供。コード生成から複雑な推論まで、コスト効率の高い高性能言語モデルを求める開発者や研究者向けです。
💡ハイライト
- ├─MoEアーキテクチャ、15Tトークン事前学習
- ├─131Kコンテキスト長、低コストAPI
- └─強力なコーディングベンチマーク(ELO 1160)
🎯対象
- ├─AI研究者
- ├─開発者
- └─コーディング愛好家