Step 3.5 Flash
🧠 एआई मॉडलstepfun
196B MoE मॉडल, प्रति टोकन केवल 11B सक्रिय, 262K संदर्भ, तेज़ और कुशल।
Step 3.5 Flash, StepFun का एक अत्याधुनिक भाषा मॉडल है, जो उच्च प्रदर्शन और दक्षता के लिए डिज़ाइन किया गया है। यह मॉडल स्पार्स MoE आर्किटेक्चर का उपयोग करता है जिसमें कुल 196B पैरामीटर हैं, लेकिन प्रति टोकन केवल 11B सक्रिय होते हैं, जिससे कम्प्यूटेशनल लागत में भारी कमी आती है जबकि मजबूत तर्क क्षमताएँ बनी रहती हैं। यह 262,144 टोकन का संदर्भ विंडो प्रदान करता है, जो लंबे दस्तावेज़ों की समझ और उत्पादन को सक्षम बनाता है। इनपुट और आउटपुट मोडैलिटी केवल टेक्स्ट हैं। मॉडल फ्रीक्वेंसी पेनल्टी, लॉजिट बायस, min_p, और रीज़निंग जैसी उन्नत सुविधाओं का समर्थन करता है। मूल्य निर्धारण $0.09 प्रति मिलियन इनपुट टोकन और $0.30 प्रति मिलियन आउटपुट टोकन है। स्रोत में बेंचमार्क प्रदान नहीं किए गए हैं, लेकिन मॉडल को StepFun के सबसे सक्षम ओपन-सोर्स ऑफरिंग के रूप में विज्ञापित किया गया है।
💡मुख्य बातें
- ├─196B MoE, प्रति टोकन 11B सक्रिय
- ├─262K टोकन संदर्भ विंडो
- └─$0.09/M इनपुट टोकन
🎯के लिए
- ├─डेवलपर्स
- ├─शोधकर्ता
- └─उद्यम