Mistral: Mistral Large 3 2512
🧠 AI मॉडलmistralai
Mistral का प्रमुख MoE मॉडल: कुल 675B, 41B सक्रिय, Apache 2.0, 262K संदर्भ।
Mistral Large 3 2512 Mistral AI द्वारा विकसित एक अत्याधुनिक भाषा मॉडल है, जो स्पार्स मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) आर्किटेक्चर का लाभ उठाता है। कुल 675 बिलियन पैरामीटर लेकिन प्रति फॉरवर्ड पास केवल 41 बिलियन सक्रिय होने के कारण, यह असाधारण प्रदर्शन और कम्प्यूटेशनल दक्षता को संतुलित करता है। यह टेक्स्ट, इमेज और फ़ाइल (जैसे PDF) इनपुट स्वीकार करता है और टेक्स्ट आउटपुट देता है। मॉडल संरचित आउटपुट, आवृत्ति/उपस्थिति दंड, और बीज-आधारित पुनरुत्पादकता जैसी उन्नत सुविधाओं का समर्थन करता है। यह प्रतिस्पर्धी बेंचमार्क स्कोर प्राप्त करता है (जैसे, 3D में ELO 1180, कोड श्रेणियों में 1194) और अनुमेय Apache 2.0 लाइसेंस के तहत पेश किया जाता है, जो अनुसंधान और वाणिज्यिक अनुप्रयोगों में व्यापक उपयोग को सक्षम बनाता है।
💡मुख्य बातें
- ├─कुल 675B MoE, केवल 41B सक्रिय
- ├─Apache 2.0 लाइसेंस
- └─262K संदर्भ लंबाई
🎯के लिए
- ├─AI शोधकर्ता
- ├─डेवलपर्स
- └─उद्यम