
pgEdge/pgedge-rag-server
📦 开源项目pgEdge
基于 Go 的轻量级 API 服务器,利用 PostgreSQL 和 pgvector 实现高效 RAG 工作流。
pgedge-rag-server 旨在架起结构化关系数据与现代生成式 AI 之间的桥梁。该服务器通过处理从已启用 pgvector 的 PostgreSQL 数据库中检索相关文本块的过程,从而简化 RAG 工作流。它充当中间件层,通过 API 管理向量嵌入和上下文检索,并将结果传递给 LLM 进行生成。
核心特性包括:
- 原生 PostgreSQL 集成:利用 pgvector 实现高性能向量搜索。
- Go 语言架构:确保 API 请求具有低延迟和高并发处理能力。
- 简化的 RAG 流水线:减少了查询向量数据并将其格式化以供 LLM 使用所需的样板代码。
- 可扩展的 API:易于集成到现有的 Web 应用程序或微服务中。
通过将 RAG 逻辑保持在靠近数据源的位置,该服务器最大限度地减少了数据移动,并利用 PostgreSQL 强大的索引功能(如 HNSW 或 IVFFlat),确保即使在数据集增长时,检索速度依然保持高效。