zai-org/GLM-5.1-FP8
🧠 AIモデルzai-org
Zhipu AIによるFP8量子化MoE言語モデル。DeepSeek Attention搭載で性能と効率を両立。
GLM-5.1-FP8は、Zhipu AIのGLM-5.1大規模言語モデルの量子化バリアントであり、MITライセンスのもとオープンソースとして公開されています。本モデルはMoE(Mixture of Experts)アーキテクチャとDeepSeek Attention(DSA)を組み合わせた構成を採用しており、DSAは長文理解と推論効率を向上させる新しいアテンション機構です。FP8(8ビット浮動小数点)量子化により、BF16/FP16版と比較してメモリフットプリントと推論計算量を大幅に削減し、競争力のある生成品質を維持しつつ、よりコスト効率の高いハードウェアへのデプロイを可能にします。英語と中国語の両方に対応するGLM-5.1-FP8は、汎用テキスト生成、対話AI、複雑な推論タスク向けに設計されています。100万件以上のダウンロードを達成し、オープンソースコミュニティで大きな支持を得ています。Hugging Faceでsafetensorsフォーマットにより安全かつ効率的に配布され、透明性のあるベンチマークのための評価結果も公開されています。
💡ハイライト
- ├─FP8量子化でメモリと計算量を削減
- ├─DeepSeek Attention搭載のMoEアーキテクチャ
- └─MITライセンス、HuggingFaceで100万DL超
🎯対象
- ├─AI研究者
- ├─LLM開発者
- └─オープンソースAI愛好家