ibm-self-serve-assets/Blended-RAG

📦 ओपन सोर्स प्रोजेक्टibm-self-serve-assets

सेमेंटिक सर्च और हाइब्रिड क्वेरी को मिलाकर LLM की सटीकता बढ़ाने वाला एक उन्नत RAG फ्रेमवर्क।

Blended-RAG मानक RAG आर्किटेक्चर की चुनौतियों का समाधान करता है, जो अक्सर सूक्ष्म प्रश्नों या डोमेन-विशिष्ट शब्दावली के साथ संघर्ष करते हैं। यह प्रोजेक्ट एक 'ब्लेंडेड' दृष्टिकोण लागू करता है जो वेक्टर-आधारित सेमेंटिक सर्च और पारंपरिक कीवर्ड-आधारित या हाइब्रिड क्वेरी रिट्रीवल विधियों की ताकत का लाभ उठाता है। इन पद्धतियों को जोड़कर, सिस्टम एक अधिक व्यापक रिट्रीवल प्रक्रिया सुनिश्चित करता है, जो उपयोगकर्ता के प्रॉम्प्ट के इरादे और विशिष्ट लेक्सिकल आवश्यकताओं दोनों को कैप्चर करता है। इस रिपॉजिटरी में मॉड्यूलर जुपिटर नोटबुक शामिल हैं जो उपयोगकर्ताओं को हाइब्रिड रिट्रीवल पाइपलाइनों के कार्यान्वयन के माध्यम से मार्गदर्शन करती हैं। मुख्य विशेषताओं में रिट्रीव किए गए दस्तावेजों को री-रैंक करना, क्वेरी विस्तार को अनुकूलित करना और सेमेंटिक समानता स्कोर को कीवर्ड घनत्व के साथ संतुलित करना शामिल है। यह दृष्टिकोण विशेष रूप से उन एंटरप्राइज़ वातावरणों के लिए प्रभावी है जहाँ सटीकता महत्वपूर्ण है और डेटा अक्सर असंरचित या तकनीकी प्रकृति का होता है। डेवलपर्स इन नोटबुक्स को विभिन्न वेक्टर डेटाबेस और LLM प्रदाताओं के साथ एकीकृत करने के लिए अनुकूलित कर सकते हैं।

💡मुख्य बातें

├─हाइब्रिड सेमेंटिक और कीवर्ड रिट्रीवल
├─अनुकूलित RAG सटीकता पाइपलाइन
└─मॉड्यूलर जुपिटर नोटबुक कार्यान्वयन

🎯के लिए

├─AI इंजीनियर्स
├─डेटा साइंटिस्ट्स
└─RAG डेवलपर्स

🔗लिंक

└─GitHub रिपॉजिटरी