
nirholas/extract-llms-docs
🔌 MCP 서버nirholas
llms.txt를 지원하는 사이트에서 AI 에이전트를 위한 문서를 추출하고 처리하는 강력한 도구입니다.
extract-llms-docs 저장소는 개발자가 AI 워크플로우에 문서를 쉽게 통합할 수 있도록 강력한 인프라를 제공합니다. 이 프로젝트는 떠오르는 llms.txt 표준을 활용하여 사이트 문서를 크롤링하고 기계가 읽을 수 있는 형식으로 파싱합니다.
주요 기술적 특징:
- MCP 서버: Claude Desktop 및 기타 MCP 호환 클라이언트와 원활하게 통합되어 실시간 문서 컨텍스트를 제공합니다.
- REST API: 문서 추출에 대한 프로그래밍 방식의 접근을 허용하여 사용자 지정 파이프라인에 통합할 수 있습니다.
- 배치 처리: 여러 URL을 효율적으로 처리하여 대규모 문서 수집에 최적화되어 있습니다.
- 다중 형식 내보내기: 다양한 LLM 컨텍스트 윈도우 및 RAG 아키텍처에 맞춘 출력 구조를 지원합니다.
TypeScript로 구축된 이 프로젝트는 확장성과 모듈성이 뛰어납니다. AI 에이전트의 '컨텍스트 부족' 문제를 해결하여 문서가 항상 최신 상태로 유지되고 LLM이 효과적으로 소화할 수 있는 형식으로 제공되도록 보장합니다. Cursor에서 사용자 지정 에이전트를 구축하든 복잡한 RAG 파이프라인을 설계하든, 이 도구는 데이터 수집 계층을 크게 단순화합니다.
💡하이라이트
- ├─기본 MCP 서버 통합 지원
- ├─URL 배치 처리 기능 제공
- └─LLM을 위한 다양한 내보내기 형식
🎯대상
- ├─AI 엔지니어
- ├─RAG 개발자
- └─테크니컬 라이터