RedHatAI/gemma-4-26B-A4B-it-NVFP4

🧠 AI मॉडलRedHatAI

NVFP4 संपीड़न के साथ अत्यधिक अनुकूलित 26B पैरामीटर Gemma-4 मॉडल, जो कुशल और उच्च-प्रदर्शन इन्फरेंस प्रदान करता है।

RedHatAI/gemma-4-26B-A4B-it-NVFP4 मॉडल, Gemma-4 26B आर्किटेक्चर की कुशल तैनाती पर केंद्रित मॉडल अनुकूलन में एक महत्वपूर्ण प्रगति है। NVFP4 क्वांटाइजेशन का लाभ उठाकर, यह मॉडल पैरामीटर घनत्व और कम्प्यूटेशनल दक्षता के बीच संतुलन बनाता है। यह मॉडल safetensors प्रारूप में उपलब्ध है, जो उत्पादन वातावरण के लिए सुरक्षित और तेज़ लोडिंग सुनिश्चित करता है। इसे विशेष रूप से vLLM के लिए अनुकूलित किया गया है, जो NVIDIA हार्डवेयर पर उच्च-थ्रूपुट इन्फरेंस की अनुमति देता है। यह रिलीज़ अत्याधुनिक ओपन-सोर्स मॉडल को उद्यम और एज अनुप्रयोगों के लिए अधिक सुलभ बनाने के व्यापक प्रयास का हिस्सा है, जहाँ मेमोरी बैंडविड्थ और VRAM क्षमता अक्सर मुख्य बाधाएं होती हैं। यह मॉडल मूल Gemma-4-26B-it की निर्देश-पालन क्षमताओं को बरकरार रखता है, जिससे संपीड़न के बावजूद प्रदर्शन में गिरावट न्यूनतम रहती है।

💡मुख्य बातें

├─26B पैरामीटर Gemma-4 आर्किटेक्चर
├─NVFP4 संपीड़न के साथ अनुकूलित
└─नेटिव vLLM और safetensors सपोर्ट

🎯के लिए

├─AI इंफ्रास्ट्रक्चर इंजीनियर
└─मशीन लर्निंग शोधकर्ता

🔗लिंक

└─HuggingFace मॉडल पेज