
DIY-Engineering/Advanced-STS-Local-AI-Assistant
📦 ओपन सोर्स प्रोजेक्टDIY-Engineering
पूरी तरह से स्थानीय और निजी स्पीच-टू-स्पीच एआई असिस्टेंट, जो ओपन-सोर्स मॉडल्स के शक्तिशाली स्टैक पर आधारित है।
यह प्रोजेक्ट एक स्थानीय, स्पीच-टू-स्पीच एआई असिस्टेंट बनाने के लिए एक मजबूत फ्रेमवर्क प्रदान करता है। इसमें एक मॉड्यूलर आर्किटेक्चर है जहाँ प्रत्येक घटक स्थानीय निष्पादन के लिए अनुकूलित है। Silero VAD कुशल वॉयस एक्टिविटी डिटेक्शन सुनिश्चित करता है, जबकि Faster-Whisper सटीक स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन प्रदान करता है। सिस्टम LLM इन्फरेंस के लिए LM Studio का उपयोग करता है, जिससे उपयोगकर्ता अपनी हार्डवेयर क्षमता के अनुसार मॉडल चुन सकते हैं। मेमोरी और संदर्भ के लिए, यह ChromaDB वेक्टर डेटाबेस में संग्रहीत MiniLM-L6-v2 एम्बेडिंग का उपयोग करता है, जो व्यक्तिगत प्रतिक्रियाओं के लिए रिट्रीवल-ऑगमेंटेड जनरेशन (RAG) को सक्षम बनाता है। अंत में, Coqui TTS टेक्स्ट प्रतिक्रियाओं को प्राकृतिक आवाज में बदलता है। यह सेटअप उन डेवलपर्स के लिए आदर्श है जो क्लाउड-आधारित एआई सेवाओं से जुड़े गोपनीयता जोखिमों के बिना निजी, लो-लेटेंसी वॉयस इंटरफेस बनाना चाहते हैं।
💡मुख्य बातें
- ├─पूरी तरह से स्थानीय, ऑफलाइन प्रोसेसिंग
- ├─VAD, STT, LLM और TTS का एकीकरण
- └─ChromaDB के माध्यम से RAG सपोर्ट
🎯के लिए
- ├─एआई डेवलपर्स
- └─गोपनीयता उत्साही