
nirholas/extract-llms-docs
🔌 MCP Servernirholas
Leistungsstarkes Tool zum Extrahieren und Verarbeiten von Dokumentationen für KI-Agenten via llms.txt.
Das Repository extract-llms-docs bietet eine robuste Infrastruktur, um Dokumentationen in KI-Workflows zu integrieren. Das Projekt nutzt den aufkommenden llms.txt-Standard, um Web-Dokumentationen zu crawlen und in maschinenlesbare Formate zu parsen.
Technische Hauptmerkmale:
- MCP-Server: Nahtlose Integration in Claude Desktop und andere MCP-konforme Clients für Echtzeit-Dokumentationskontext.
- REST-API: Ermöglicht den programmatischen Zugriff auf die Extraktion, ideal für benutzerdefinierte Pipelines.
- Stapelverarbeitung: Effiziente Handhabung mehrerer URLs für die großflächige Aggregation von Dokumentationen.
- Multi-Format-Export: Unterstützt verschiedene Ausgabestrukturen, die auf unterschiedliche LLM-Kontextfenster und RAG-Architekturen zugeschnitten sind.
Das in TypeScript entwickelte Projekt ist hochgradig erweiterbar und modular. Es löst das Problem des 'Kontextmangels' bei KI-Agenten, indem es sicherstellt, dass Dokumentationen stets aktuell und in einem für LLMs leicht verdaulichen Format vorliegen. Egal, ob Sie einen benutzerdefinierten Agenten in Cursor oder eine komplexe RAG-Pipeline erstellen, dieses Tool vereinfacht die Datenaufnahme erheblich.
💡Highlights
- ├─Native MCP-Server-Integration
- ├─Unterstützt Stapelverarbeitung
- └─Diverse Exportformate für LLMs
🎯Für
- ├─KI-Ingenieure
- ├─RAG-Entwickler
- └─Technische Redakteure