Qwen/Qwen2.5-7B-Instruct-AWQ

🧠 AIモデルQwen

AWQ量子化された7B指示チューニングモデル、効率的なテキスト生成

Qwen2.5-7B-Instruct-AWQは、Qwenチームによって作成されたQwen2.5-7B-Instructモデルの量子化バリアントです。ベースモデル（Qwen/Qwen2.5-7B-Instruct）は、指示に従いマルチターン対話を行うようファインチューニングされたトランスフォーマーベースのデコーダー言語モデルです。AWQ量子化技術は、活性化の大きさを分析して重みを圧縮し、メモリフットプリントを大幅に削減し、精度の低下を最小限に抑えながら推論を高速化します。このバージョンは、コンシューマーGPUやエッジデバイスへの展開に最適化されています。長いコンテキスト（最大32Kトークン）をサポートし、MMLU、GSM8K、HumanEvalなどのベンチマークで高いパフォーマンスを維持します。オープンライセンスで公開されており、Hugging Face TransformersやvLLMと互換性があります。

💡ハイライト

├─70億パラメータ、AWQ量子化
├─指示チューニング済み、対話対応
└─効率最適化（メモリ・レイテンシ削減）

🎯対象

├─AI研究者
├─MLエンジニア
└─対話型AI開発者

🔗リンク

└─Hugging Faceモデルカード