rhasspy/faster-whisper-base-int8

🧠 AI मॉडलrhasspy

ओपनएआई के व्हिस्पर बेस मॉडल का एक अनुकूलित, क्वांटाइज्ड संस्करण, जो तेज और कम संसाधन वाली स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन के लिए है।

rhasspy/faster-whisper-base-int8 मॉडल मूल व्हिस्पर आर्किटेक्चर का एक महत्वपूर्ण अनुकूलन है। 8-बिट इंटीजर क्वांटाइजेशन (INT8) लागू करके, मॉडल का आकार काफी कम हो गया है, जिससे यह उन CPUs और एज डिवाइसों पर कुशलतापूर्वक चल सकता है जहाँ GPU संसाधन उपलब्ध नहीं हैं या सीमित हैं। यह मॉडल विशेष रूप से faster-whisper कार्यान्वयन के साथ काम करने के लिए डिज़ाइन किया गया है, जो CTranslate2 का उपयोग करके मानक OpenAI कार्यान्वयन की तुलना में 4 गुना तक तेज प्रदर्शन प्राप्त करता है। यह गोपनीयता-केंद्रित, स्थानीय-प्रथम वॉयस इंटरफेस, होम ऑटोमेशन सिस्टम, या रीयल-टाइम ट्रांसक्रिप्शन सेवाओं का निर्माण करने वाले डेवलपर्स के लिए विशेष रूप से उपयुक्त है। यह मॉडल मूल व्हिस्पर मॉडल की मजबूत बहुभाषी क्षमताओं को बरकरार रखता है, जो विभिन्न लहजों और वातावरणों में सुसंगत प्रदर्शन सुनिश्चित करता है। इसका MIT-लाइसेंस इसे व्यावसायिक और ओपन-सोर्स एकीकरण के लिए अत्यधिक सुलभ बनाता है, जो डेवलपर्स को क्लाउड-आधारित API पर निर्भर हुए बिना उच्च-प्रदर्शन स्पीच रिकग्निशन लागू करने के लिए एक विश्वसनीय आधार प्रदान करता है।

💡मुख्य बातें

├─एज दक्षता के लिए 8-बिट क्वांटाइज्ड
├─मानक व्हिस्पर से 4 गुना तक तेज
└─CTranslate2 इंजन के लिए अनुकूलित

🎯के लिए

├─एज AI डेवलपर्स
└─वॉयस असिस्टेंट इंजीनियर

🔗लिंक

└─हगिंग फेस रिपॉजिटरी