mistralai/Mixtral-8x7B-Instruct-v0.1

🧠 AIモデルmistralai

47Bパラメータの高性能なSparse Mixture-of-Experts (SMoE) モデル。指示追従と多言語タスクに最適化。

Mixtral-8x7B-Instruct-v0.1は、オープンウェイトAI開発における重要なマイルストーンです。デコーダーのみのSparse Mixture-of-Expertsアーキテクチャを採用し、各トークンを8つのエキスパートネットワークのサブセットにルーティングします。この選択的なアクティブ化により、推論時の計算効率が維持され、パフォーマンスを犠牲にすることなく高いスループットを実現します。教師あり微調整と直接選好最適化（DPO）を用いて調整されており、複雑な指示への追従、チャット、マルチターン対話に優れています。32kトークンのコンテキストウィンドウをサポートしており、長文ドキュメントの分析や複雑な推論タスクに適しています。vLLMなどの標準的な推論フレームワークと完全に互換性があり、safetensors形式を採用しているため、高性能なローカルまたはクラウドホスト型のAIアプリケーションを構築する開発者にとって最適な選択肢です。

💡ハイライト

├─47Bパラメータ、トークンあたり13Bをアクティブ化
├─32kトークンのコンテキストウィンドウをサポート
└─多言語対応の指示チューニング済み

🎯対象

├─AI研究者
├─機械学習エンジニア
└─ソフトウェア開発者

🔗リンク

└─Hugging Face モデルカード