Qwen/Qwen2.5-7B-Instruct-AWQ
🧠 AIモデルQwen
AWQ量子化された7B指示チューニングモデル、効率的なテキスト生成
Qwen2.5-7B-Instruct-AWQは、Qwenチームによって作成されたQwen2.5-7B-Instructモデルの量子化バリアントです。ベースモデル(Qwen/Qwen2.5-7B-Instruct)は、指示に従いマルチターン対話を行うようファインチューニングされたトランスフォーマーベースのデコーダー言語モデルです。AWQ量子化技術は、活性化の大きさを分析して重みを圧縮し、メモリフットプリントを大幅に削減し、精度の低下を最小限に抑えながら推論を高速化します。このバージョンは、コンシューマーGPUやエッジデバイスへの展開に最適化されています。長いコンテキスト(最大32Kトークン)をサポートし、MMLU、GSM8K、HumanEvalなどのベンチマークで高いパフォーマンスを維持します。オープンライセンスで公開されており、Hugging Face TransformersやvLLMと互換性があります。
💡ハイライト
- ├─70億パラメータ、AWQ量子化
- ├─指示チューニング済み、対話対応
- └─効率最適化(メモリ・レイテンシ削減)
🎯対象
- ├─AI研究者
- ├─MLエンジニア
- └─対話型AI開発者