nannib/nbmultirag

🏗️ फ्रेमवर्कnannib

मल्टीमीडिया दस्तावेजों (ऑडियो, वीडियो, इमेज, OCR) के साथ चैट करने के लिए एक द्विभाषी RAG फ्रेमवर्क।

nbmultirag एक ओपन-सोर्स फ्रेमवर्क है जिसे पारंपरिक टेक्स्ट-आधारित RAG और आधुनिक मल्टीमॉडल आवश्यकताओं के बीच की खाई को पाटने के लिए डिज़ाइन किया गया है। पायथन और स्ट्रीमलिट (Streamlit) के साथ निर्मित, यह विषम डेटा प्रकारों को इनजेस्ट, प्रोसेस और क्वेरी करने के पाइपलाइन को सरल बनाता है। यह फ्रेमवर्क इमेज-आधारित दस्तावेजों के लिए OCR और ऑडियो/वीडियो सामग्री के लिए विशेष एक्सट्रैक्टर्स का उपयोग करके मल्टीमीडिया इनपुट को संभालने में उत्कृष्ट है। इसकी मुख्य विशेषताओं में एक मॉड्यूलर आर्किटेक्चर शामिल है जो रिट्रीवल और जनरेशन चरणों के आसान अनुकूलन की अनुमति देता है। यह विभिन्न LLM बैकएंड के साथ एकीकरण का समर्थन करता है, जिससे डेवलपर्स ऐसे परिष्कृत चैटबॉट तैनात कर सकते हैं जो विभिन्न मीडिया प्रारूपों में संदर्भ को समझते हैं। चाहे आप वीडियो ट्रांसक्रिप्ट का विश्लेषण करने वाला शोध सहायक बना रहे हों या स्कैन की गई छवियों को इंडेक्स करने वाला दस्तावेज़ प्रबंधन सिस्टम, nbmultirag मल्टीमॉडल रिट्रीवल की जटिलताओं को संभालने के लिए आवश्यक एब्स्ट्रैक्शन प्रदान करता है।

💡मुख्य बातें

├─मल्टीमॉडल RAG (ऑडियो, वीडियो, OCR)
├─द्विभाषी समर्थन (EN/IT)
└─स्ट्रीमलिट-आधारित UI एकीकरण

🎯के लिए

├─AI डेवलपर्स
└─डेटा इंजीनियर्स

🔗लिंक

└─GitHub रिपॉजिटरी