mlc-ai/web-llm-chat

📦 开源项目mlc-ai

利用 WebGPU 在浏览器中原生运行大语言模型，实现私密、无需服务器的 AI 对话。

Web-LLM-Chat 代表了边缘 AI 的重大进步，它利用 WebLLM 引擎将复杂的生成式 AI 能力引入浏览器环境。通过 WebGPU 调用客户端硬件，该应用无需外部 API 调用或服务器基础设施即可实现高效推理。这种架构对于注重隐私的开发者和用户极具创新性，因为所有模型权重和对话数据都保留在用户的本地设备上。该项目基于 TypeScript 和 Next.js 构建，为希望将本地 LLM 集成到 Web 应用中的开发者提供了友好的开发体验。它支持包括 Qwen、Phi-2 和 TinyLlama 在内的多种模型架构，可根据用户的硬件能力提供灵活的部署选项。其模块化设计使其成为构建离线运行、跨现代浏览器扩展的隐私优先 AI 界面的理想起点。

💡核心亮点

├─原生 WebGPU 模型加速推理
├─零服务器架构保障隐私安全
└─支持 Llama、Mistral 及 Gemma

🎯适用人群

├─Web 开发者
├─隐私倡导者
└─AI 研究人员

🔗链接

└─GitHub 仓库