
Olney1/ChatGPT-OpenAI-Smart-Speaker
📦 오픈소스 프로젝트Olney1
음성과 시각을 지원하는 스마트 스피커, OpenAI와 LangChain 에이전트 기반 웹 검색 기능 탑재.
ChatGPT-OpenAI-Smart-Speaker 프로젝트는 음성과 시각 기반의 포괄적인 스마트 스피커 애플리케이션입니다. 음성 입력을 위한 STT(음성-텍스트), 응답을 위한 TTS(텍스트-음성), 환경을 인식하는 카메라 비전을 활용합니다. LangChain 에이전트를 통합하여 Tavily를 통한 웹 검색 등 복잡한 작업을 조율하고, LangSmith를 통해 모니터링 및 디버깅을 수행합니다. GPT-4를 지원하여 지능적인 대화가 가능하며, 사용자는 음성이나 시각 입력을 통해 질문하고 실시간 정보를 얻고 상호작용할 수 있습니다. 코드는 Python으로 작성되었으며, Raspberry Pi나 데스크톱에 쉽게 배포할 수 있도록 설계되었습니다. 주요 기능으로는 다중 모달 상호작용, 사용자 정의 가능한 에이전트 워크플로우, 원활한 OpenAI API 통합 등이 있습니다. 이 프로젝트는 일상 기기에서 AI 에이전트의 실용적인 응용을 보여줍니다.
💡하이라이트
- ├─다중 모달 음성 및 시각
- ├─LangChain 에이전트 오케스트레이션
- └─GPT-4 + Tavily 웹 검색
🎯대상
- ├─AI 개발자
- ├─스마트 홈 애호가
- └─오픈소스 기여자