meta-llama/Llama-3.2-1B-Instruct

🧠 AI मॉडलmeta-llama

1B निर्देश-ट्यून्ड लामा, कुशल ऑन-डिवाइस AI के लिए।

Llama-3.2-1B-Instruct मेटा का एक टेक्स्ट जनरेशन मॉडल है, जिसे Llama 3.2 फाउंडेशनल मॉडल से सुपरवाइज्ड लर्निंग और मानव फीडबैक के साथ रीइन्फोर्समेंट लर्निंग का उपयोग करके फाइन-ट्यून किया गया है। इसमें 1B पैरामीटर ट्रांसफॉर्मर है जिसमें Grouped Query Attention (GQA) है और यह 128k टोकन की शब्दावली का उपयोग करता है। मॉडल को उपभोक्ता हार्डवेयर पर कुशल तैनाती के लिए डिज़ाइन किया गया है, जो स्थानीय रूप से चलने वाले AI सहायकों को सक्षम बनाता है। यह Hugging Face transformers और vLLM जैसे सिस्टम का समर्थन करता है, और गेटेड है (मेटा के लाइसेंस की स्वीकृति आवश्यक)। अपने छोटे आकार के बावजूद, यह अपनी श्रेणी के लिए MMLU और GSM8k जैसे बेंचमार्क में प्रतिस्पर्धी प्रदर्शन करता है।

💡मुख्य बातें

├─1B पैरामीटर, GQA अटेंशन
├─निर्देश-ट्यून्ड, उच्च दक्षता
└─5.6M+ डाउनलोड, गेटेड पहुंच

🎯के लिए

├─मोबाइल डेवलपर्स
├─एज AI इंजीनियर्स
└─गोपनीयता-जागरूक शोधकर्ता

🔗लिंक

└─HuggingFace मॉडल कार्ड