
kreuzberg-dev/kreuzberg-surrealdb
🔧 टूलkreuzberg-dev
RAG के लिए 88+ दस्तावेज़ प्रारूपों को सीधे SurrealDB में निकालने, चंक करने और एम्बेड करने वाला शक्तिशाली पायथन पाइपलाइन।
kreuzberg-surrealdb एक विशेष पायथन-आधारित यूटिलिटी है जिसे असंरचित दस्तावेज़ स्टोरेज और वेक्टर-सक्षम डेटाबेस के बीच की खाई को पाटने के लिए डिज़ाइन किया गया है। यह उच्च-सटीक टेक्स्ट एक्सट्रैक्शन सुनिश्चित करने के लिए Kreuzberg इंजन का उपयोग करता है, जो पीडीएफ और ऑफिस दस्तावेज़ों से लेकर जटिल तकनीकी प्रारूपों तक, फ़ाइल स्वरूपों की एक विस्तृत श्रृंखला को पार्स करता है। मुख्य विशेषताओं में LLM संदर्भ विंडो के लिए अनुकूलित स्वचालित टेक्स्ट चंकिंग रणनीतियाँ और एम्बेडिंग मॉडल के साथ सहज एकीकरण शामिल है। संसाधित होने के बाद, डेटा को सीधे SurrealDB में भेजा जाता है, जो प्राथमिक दस्तावेज़ स्टोर और वेक्टर सर्च इंजन दोनों के रूप में कार्य करता है। यह जटिल मिडलवेयर या अलग वेक्टर डेटाबेस सिंक्रनाइज़ेशन की आवश्यकता को समाप्त करता है, जो इसे स्केलेबल, दस्तावेज़-प्रधान AI एप्लिकेशन बनाने वाले डेवलपर्स के लिए एक आदर्श समाधान बनाता है।
💡मुख्य बातें
- ├─88+ फ़ाइल प्रारूपों का समर्थन
- ├─सीधा SurrealDB एकीकरण
- └─स्वचालित चंकिंग और एम्बेडिंग
🎯के लिए
- ├─AI इंजीनियर्स
- ├─बैकएंड डेवलपर्स
- └─डेटा आर्किटेक्ट्स