
icereed/paperless-gpt
📦 Open Source Projekticereed
Automatisieren Sie die Dokumentenverarbeitung in paperless-ngx mit LLMs und Vision-Modellen für intelligente Klassifizierung und Datenextraktion.
paperless-gpt fungiert als leistungsstarke Middleware für paperless-ngx und ermöglicht es Benutzern, die Stärken von Large Language Models und Vision-Language Models (VLMs) für die Dokumentenautomatisierung zu nutzen. Das in Go geschriebene Projekt ist auf Effizienz und eine nahtlose Integration in bestehende Dokumenten-Pipelines ausgelegt. Es zeichnet sich durch Aufgaben wie die automatische Dokumentenkategorisierung, intelligente Verschlagwortung und die Extraktion spezifischer Datenpunkte aus Rechnungen, Quittungen oder Verträgen aus.
Das Tool unterstützt eine Vielzahl von Backends, darunter Ollama für eine lokale, datenschutzorientierte Verarbeitung sowie verschiedene Cloud-basierte LLM-APIs. Durch den Einsatz von Vision-Modellen umgeht es die Einschränkungen herkömmlicher, starrer OCR-Systeme und ermöglicht es dem System, den Kontext und Inhalt eines Dokuments zu „verstehen“, anstatt nur eine Zeichenerkennung durchzuführen. Dies führt zu einer höheren Genauigkeit bei komplexen Dokumenten und reduziert den manuellen Aufwand. Zu den Hauptmerkmalen gehören konfigurierbare Prompt-Vorlagen, die Unterstützung mehrerer LLM-Anbieter und eine modulare Architektur, die eine einfache Skalierung bei steigendem Dokumentenvolumen ermöglicht.
💡Highlights
- ├─Integration von LLMs in paperless-ngx
- ├─Lokales Ollama & Cloud-API-Support
- └─Automatisches Tagging & Klassifizierung
🎯Für
- ├─Heimautomatisierungs-Enthusiasten
- ├─Administratoren für Dokumentenmanagement
- └─Datenschutzorientierte Entwickler