Qwen/Qwen3-0.6B-FP8

🧠 AI मॉडलQwen

FP8 क्वांटाइज़्ड 0.6B पैरामीटर Qwen3 मॉडल, कुशल टेक्स्ट जनरेशन के लिए।

Qwen3-0.6B-FP8, ओपन-सोर्स Qwen3-0.6B बेस मॉडल पर आधारित है, जो FP8 क्वांटाइज़ेशन लागू करके मॉडल आकार को कम करता है और उच्च आउटपुट गुणवत्ता बनाए रखते हुए अनुमान को गति देता है। FP8 प्रारूप FP16 की तुलना में मेमोरी फ़ुटप्रिंट को लगभग 50% कम करता है, जिससे उपभोक्ता GPU और एज उपकरणों पर तैनाती संभव होती है। मॉडल टेक्स्ट जनरेशन और संवादी अनुप्रयोगों के लिए अनुकूलित है, और Transformers और Safetensors प्रारूपों का समर्थन करता है। इसे Apache 2.0 लाइसेंस के तहत जारी किया गया है, जो अनुसंधान और उत्पादन के लिए व्यापक अपनाने और अनुकूलन को बढ़ावा देता है। मजबूत सामुदायिक अपनाने (1.36M डाउनलोड) के साथ, यह छोटे, क्वांटाइज़्ड LLM की कुशल AI कार्यभार के लिए व्यवहार्यता प्रदर्शित करता है।

💡मुख्य बातें

├─0.6B पैरामीटर, FP8 क्वांटाइज़्ड
├─1.36M+ HuggingFace डाउनलोड
└─Apache-2.0 ओपन सोर्स लाइसेंस

🎯के लिए

├─LLM शोधकर्ता
├─AI अनुप्रयोग डेवलपर
└─एज AI इंजीनियर

🔗लिंक

└─HuggingFace मॉडल कार्ड