DIY-Engineering/Advanced-STS-Local-AI-Assistant

📦 오픈 소스 프로젝트DIY-Engineering

오픈 소스 모델 스택을 활용한 완전 로컬 기반의 프라이빗 음성 대화형 AI 어시스턴트.

이 프로젝트는 로컬 음성 대화형 AI 어시스턴트를 구축하기 위한 강력한 프레임워크를 제공합니다. 각 구성 요소는 로컬 실행에 최적화된 모듈형 아키텍처로 설계되었습니다. Silero VAD는 효율적인 음성 활동 감지를 수행하며, Faster-Whisper는 빠르고 정확한 음성-텍스트 변환을 지원합니다. LM Studio를 LLM 추론 백엔드로 사용하여 사용자의 하드웨어 사양에 맞춰 모델을 자유롭게 교체할 수 있습니다. 또한 MiniLM-L6-v2 임베딩과 ChromaDB 벡터 데이터베이스를 통해 RAG(검색 증강 생성) 기능을 구현하여 개인화된 응답을 제공하며, Coqui TTS가 텍스트를 자연스러운 음성으로 변환합니다. 클라우드 기반 AI 서비스의 비용과 개인정보 위험 없이 로컬에서 저지연 음성 인터페이스를 구축하려는 개발자에게 최적의 솔루션입니다.

💡하이라이트

├─완전 로컬 기반의 오프라인 처리
├─VAD, STT, LLM, TTS 통합 스택
└─ChromaDB를 활용한 RAG 기능 탑재

🎯대상

├─AI 개발자
└─개인정보 보호 애호가

🔗링크

└─GitHub 저장소