
moodlehq/wiki-rag
📦 开源项目moodlehq
一个实验性 RAG 系统,旨在摄取 MediaWiki 内容并提供兼容 OpenAI 的 API 接口。
wiki-rag 是一个基于 Python 的专业框架,旨在将静态的 MediaWiki 文档转化为动态、可查询的知识库。其核心功能是通过 MediaWiki API 自动化摄取 Wiki 页面,并将内容处理并嵌入到 Milvus 向量数据库中,以实现高效的语义搜索。
主要技术特性包括:
- 自动化的 MediaWiki 摄取流水线。
- 使用 Milvus 进行向量检索,支持高性能相似度搜索。
- 兼容 OpenAI 的 API 接口,确保与标准 LLM 客户端和框架的兼容性。
- 专为 RAG 优化实验研究设计的模块化架构。
通过提供标准化的接口,wiki-rag 使开发者能够将 Wiki 内容作为 RAG 应用的实时数据源。对于那些维护大量文档并希望在不手动迁移数据的情况下实现 AI 驱动的客服机器人或内部知识助手的团队来说,该项目尤为实用。
💡核心亮点
- ├─支持 MediaWiki API 自动化数据摄取
- ├─基于 Milvus 的高性能向量存储与检索
- └─提供兼容 OpenAI 标准的 API 接口
🎯适用人群
- ├─知识管理人员
- ├─AI 工程师
- └─DevOps 工程师