
icereed/paperless-gpt
📦 オープンソースプロジェクトicereed
LLMとVisionモデルを活用し、paperless-ngxの文書処理を自動化・高度化するツール。
paperless-gptは、paperless-ngxのための強力なミドルウェアとして機能し、大規模言語モデル(LLM)および視覚言語モデル(VLM)の能力を文書自動化に活用します。Go言語で記述されたこのプロジェクトは、既存のドキュメント管理パイプラインとのシームレスな統合と効率性を重視しています。文書の自動分類、インテリジェントなタグ付け、請求書や領収書、契約書からの特定データ抽出といったタスクに最適です。
Ollamaを用いたプライバシー重視のローカル処理から、各種クラウドLLM APIまで幅広いバックエンドをサポートしています。Visionモデルを利用することで、従来の固定的なOCRの限界を超え、単なる文字認識だけでなく文書の文脈や内容を「理解」することが可能です。これにより、複雑な文書でも高い精度を実現し、手作業を大幅に削減します。設定可能なプロンプトテンプレート、複数のLLMプロバイダーへの対応、文書量の増加に合わせて拡張可能なモジュール式アーキテクチャが特徴です。
💡ハイライト
- ├─LLMとpaperless-ngxを統合
- ├─ローカルOllamaおよびクラウドAPI対応
- └─タグ付けと分類を自動化
🎯対象
- ├─ホームオートメーション愛好家
- ├─ドキュメント管理管理者
- └─プライバシー重視の開発者