WizardLM-2 8x22B

🧠 AIモデルmicrosoft

マイクロソフトの最新オープンソースWizardモデル、MoEアーキテクチャ、8x22Bパラメータ。

マイクロソフトによって開発されたWizardLM-2 8x22Bは、WizardLMシリーズをベースに、8つのエキスパート（各22Bパラメータ）を持つMixture of Experts（MoE）アーキテクチャを採用。この設計により、トークンごとに22Bのみが活性化され効率的な推論が可能で、総パラメータ数は176Bに達する。最大65,536トークンのコンテキストをサポートし、入出力ともに100万トークンあたり0.62ドルの価格設定。テキストモダリティをサポートし、frequency_penalty、max_tokens、presence_penalty、repetition_penalty、response_format、seed、stop、temperatureなどの機能を備える。既存のオープンソースモデルを一貫して凌ぎ、プロプライエタリモデルに匹敵するため、幅広いテキストベースのAIアプリケーションに強力な選択肢となる。

💡ハイライト

├─8x22B MoE、22Bのみ活性化
├─65Kコンテキスト長
└─プロプライエタリモデルに匹敵

🎯対象

├─AI研究者
├─開発者
└─オープンソース愛好家

🔗リンク

└─OpenRouterモデルページ