mlc-ai/web-llm-chat

📦 Open Source Projektmlc-ai

Führen Sie große Sprachmodelle nativ im Browser aus – dank WebGPU für private, serverlose KI-Chats.

Web-LLM-Chat stellt einen bedeutenden Fortschritt im Bereich Edge-KI dar und nutzt die WebLLM-Engine, um anspruchsvolle generative KI-Funktionen in die Browserumgebung zu bringen. Durch den Zugriff auf die Hardware des Clients via WebGPU erzielt die Anwendung eine effiziente Inferenz, ohne dass externe API-Aufrufe oder eine Serverinfrastruktur erforderlich sind. Diese Architektur ist besonders innovativ für datenschutzbewusste Entwickler und Nutzer, da alle Modellgewichte und Konversationsdaten lokal auf dem Gerät verbleiben. Das Projekt basiert auf TypeScript und Next.js und bietet Entwicklern eine vertraute Umgebung, um lokale LLMs in Webanwendungen zu integrieren. Es unterstützt eine breite Palette von Modellarchitekturen, darunter Qwen, Phi-2 und TinyLlama, was flexible Bereitstellungsoptionen je nach Hardwarekapazität ermöglicht. Das modulare Design macht das Projekt zum idealen Ausgangspunkt für den Aufbau datenschutzorientierter KI-Schnittstellen, die offline funktionieren und in modernen Browsern skalierbar sind.

💡Highlights

├─Native WebGPU-Modellbeschleunigung
├─Serverlose Datenschutzarchitektur
└─Unterstützt Llama, Mistral & Gemma

🎯Für

├─Webentwickler
├─Datenschützer
└─KI-Forscher

🔗Links

└─GitHub-Repository