cyankiwi/gemma-4-26B-A4B-it-AWQ-4bit

🧠 AI Modelcyankiwi

कुशल मल्टीमॉडल इनफ़रेंस के लिए AWQ 4-बिट परिमाणित Gemma 4 MoE।

यह मॉडल Google के Gemma 4 26B-A4B-it, एक मल्टीमॉडल MoE (विशेषज्ञों का मिश्रण) मॉडल का AWQ (एक्टिवेशन-अवेयर वेट क्वांटाइज़ेशन) 4-बिट परिमाणित संस्करण है, जिसमें कुल 26B पैरामीटर और प्रति टोकन 4B सक्रिय हैं। यह इमेज-टेक्स्ट-टू-टेक्स्ट कार्यों का समर्थन करता है और उपभोक्ता हार्डवेयर पर कुशल इनफ़रेंस के लिए अनुकूलित है। क्वांटाइज़ेशन मूल मॉडल की अधिकांश गुणवत्ता को संरक्षित करता है जबकि मेमोरी और कम्प्यूटेशनल आवश्यकताओं को कम करता है। मॉडल Apache 2.0 लाइसेंस के तहत उपलब्ध है और हगिंग फेस के ट्रांसफॉर्मर्स और एंडपॉइंट्स के साथ संगत है। इसने 3.3 मिलियन से अधिक डाउनलोड के साथ महत्वपूर्ण अपनाया है।

💡मुख्य बातें

├─AWQ 4-बिट क्वांटाइज़ेशन
├─26B MoE, 4B सक्रिय
└─3.3M+ हगिंग फेस डाउनलोड

🎯के लिए

├─AI शोधकर्ता
├─डेवलपर्स
└─शौकिया

🔗लिंक

└─हगिंग फेस मॉडल