lmstudio-community/gemma-4-E4B-it-MLX-8bit

🧠 AI Modellmstudio-community

Optimierte 8-Bit MLX-Quantisierung von Googles Gemma 4-E4B für effiziente lokale Ausführung auf Apple Silicon.

Dieses Modell ist eine spezialisierte Portierung der Google Gemma 4-E4B-it-Architektur, konvertiert in das MLX-Format mit 8-Bit-Gewichtungsquantisierung. MLX ist Apples Machine-Learning-Framework, das speziell für die effiziente Ausführung auf Apple Silicon (M-Serie-Chips) entwickelt wurde. Durch die 8-Bit-Quantisierung erreicht das Modell ein optimales Gleichgewicht zwischen Recheneffizienz und Ausgabequalität, wodurch komplexe Bild-zu-Text-Aufgaben mit geringerem VRAM-Bedarf im Vergleich zu Vollpräzisionsgewichten möglich sind. Das Modell unterstützt die 'Any-to-Any'-Pipeline und ermöglicht vielseitige multimodale Interaktionen. Es wird im Safetensors-Format bereitgestellt, was schnelles und sicheres Laden gewährleistet und die Kompatibilität mit dem Hugging Face-Ökosystem sowie lokalen Inferenz-Tools wie LM Studio sicherstellt. Diese Veröffentlichung ist besonders wichtig für Entwickler, die modernste multimodale Funktionen in lokale Anwendungen integrieren möchten, ohne auf Cloud-basierte API-Endpunkte angewiesen zu sein.

💡Highlights

├─8-Bit MLX-optimierte Quantisierung
├─Unterstützt Any-to-Any multimodale Aufgaben
└─Native Apple Silicon Beschleunigung

🎯Für

├─KI-Entwickler
└─Apple Silicon-Nutzer

🔗Links

└─Hugging Face Repository