cyankiwi/gemma-4-31B-it-AWQ-4bit

🧠 AI मॉडलcyankiwi

Google के Gemma-4-31B-it मॉडल का अत्यधिक अनुकूलित 4-बिट AWQ क्वांटाइज्ड संस्करण, जो कुशल इन्फरेंस के लिए तैयार है।

यह मॉडल Gemma-4-31B-it आर्किटेक्चर का एक विशेष डिप्लॉयमेंट है, जिसे उच्च-दक्षता वाले इन्फरेंस के लिए इंजीनियर किया गया है। 4-बिट AWQ लागू करके, यह मॉडल अपने पूर्ण-सटीक संस्करण की तुलना में मेमोरी फुटप्रिंट में भारी कमी लाता है, जिससे यह उपभोक्ता-ग्रेड हार्डवेयर पर भी चल सकता है। यह मॉडल इमेज-टू-टेक्स्ट पाइपलाइनों का समर्थन करता है और मल्टीमॉडल समझ में Gemma आर्किटेक्चर की ताकत का लाभ उठाता है। इसे safetensors प्रारूप में वितरित किया गया है, जो transformers लाइब्रेरी के माध्यम से सुरक्षित और तेज़ लोडिंग सुनिश्चित करता है। यह रिलीज़ उन डेवलपर्स के लिए विशेष रूप से मूल्यवान है जो संसाधन-सीमित वातावरण में शक्तिशाली मल्टीमॉडल मॉडल को एकीकृत करना चाहते हैं।

💡मुख्य बातें

├─4-बिट AWQ क्वांटाइजेशन
├─इमेज-टू-टेक्स्ट का समर्थन
└─कम VRAM के लिए अनुकूलित

🎯के लिए

├─AI शोधकर्ता
├─एज कंप्यूटिंग डेवलपर्स
└─मशीन लर्निंग इंजीनियर

🔗लिंक

└─Hugging Face रिपॉजिटरी