Qwen3-30B-A3B
🧠 KI-ModellQwen
30B-parametriges MoE-Modell mit nur 3B aktivierten Parametern pro Token, Open Source unter Apache 2.0.
Qwen3-30B-A3B ist ein hochmodernes Textgenerierungsmodell, das eine Mixture-of-Experts (MoE) Architektur von Qwen verwendet. Es hat insgesamt 30 Milliarden Parameter, von denen nur 3 Milliarden pro Vorwärtsdurchlauf aktiviert werden, was hohe Leistung bei geringeren Rechenkosten ermöglicht. Das Modell ist vom Basis-Modell (Qwen3-30B-A3B-Base) feinabgestimmt und unter der permissiven Apache 2.0 Lizenz veröffentlicht. Es erzielt wettbewerbsfähige Ergebnisse in verschiedenen Benchmarks und ist effizient für den Einsatz. Die Architektur verwendet Top-k-Routing, spezialisierte Expertenmodule, SwiGLU-Aktivierungen und rotierende Positionscodierungen. Es ist Teil der Qwen3-Familie, die Modelle von 0,5B bis 236B Parametern umfasst. Verfügbar auf Hugging Face mit über 1,5 Millionen Downloads und 900 Likes, ist es für das Verständnis langer Kontexte und eine breite Palette von Aufgaben in natürlicher Sprache konzipiert.
💡Highlights
- ├─30B MoE, 3B aktiv pro Token
- ├─Apache 2.0 Lizenz
- └─1,5 Mio. Downloads, 900 Likes
🎯Für
- ├─KI-Forschende
- ├─Maschinenlern-Ingenieure
- └─Open-Source-Enthusiasten