MiniMaxAI/MiniMax-M2.7

🧠 AI मॉडलMiniMaxAI

ओपन-सोर्स 457B MoE मॉडल जिसमें 45.9B सक्रिय पैरामीटर हैं, चैट और कोडिंग कार्यों में अग्रणी प्रदर्शन।

MiniMax-M2.7 MiniMaxAI द्वारा विकसित 457B पैरामीटर वाला Mixture-of-Experts (MoE) मॉडल है जिसमें प्रति टोकन 45.9B सक्रिय पैरामीटर हैं। यह टेक्स्ट जनरेशन, संवादी AI और कोडिंग सहायता के लिए डिज़ाइन किया गया है। मॉडल दक्षता और प्रदर्शन के लिए कस्टम ऑप्टिमाइज़ेशन के साथ ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है। इसकी तुलना GPT-4, Claude और Llama जैसे अग्रणी मॉडलों से की गई है, और MMLU, HumanEval, MBPP, और GSM8K पर प्रतिस्पर्धी परिणाम दिखाए हैं। मॉडल एक कस्टम ओपन-सोर्स लाइसेंस के तहत जारी किया गया है, जो अनुसंधान और वाणिज्यिक दोनों उपयोगों की अनुमति देता है। यह FP8 इन्फ्रेंस को सपोर्ट करता है और HuggingFace Transformers लाइब्रेरी के साथ संगत है। रिलीज़ में मॉडल वेट, मूल्यांकन स्क्रिप्ट और उदाहरण कोड शामिल हैं।

💡मुख्य बातें

├─457B MoE, 45.9B सक्रिय प्रति टोकन
├─चैट, कोडिंग, गणित बेंचमार्क पर SOTA
└─अनुमोदित लाइसेंस के साथ ओपन-सोर्स

🎯के लिए

├─AI शोधकर्ता
├─ML इंजीनियर
└─चैटबॉट डेवलपर्स

🔗लिंक

└─HuggingFace मॉडल