zai-org/GLM-OCR

🧠 एआई मॉडलzai-org

GLM आर्किटेक्चर पर आधारित ओपन-सोर्स OCR मॉडल जो छवियों से उच्च-सटीकता पाठ निकालता है।

GLM-OCR शक्तिशाली GLM (General Language Model) आर्किटेक्चर का लाभ उठाकर उन्नत ऑप्टिकल कैरेक्टर रिकॉग्निशन करता है। पारंपरिक OCR सिस्टम के विपरीत जो अलग-अलग डिटेक्शन और रिकॉग्निशन चरणों पर निर्भर होते हैं, GLM-OCR एक एंड-टू-एंड इमेज-टू-टेक्स्ट मॉडल है जो सीधे पाठ वाली छवियों को डिजिटल पाठ में परिवर्तित कर सकता है। इसे संवादात्मक AI अनुप्रयोगों के लिए डिज़ाइन किया गया है, जो इंटरैक्टिव पाठ निष्कर्षण सक्षम करता है। मॉडल को कई भाषाओं और लिपियों को कवर करने वाले विविध डेटासेट पर प्रशिक्षित किया गया है, जो इसे विभिन्न उपयोग के मामलों के लिए मजबूत बनाता है। HuggingFace के transformers लाइब्रेरी के साथ एकीकरण आसान पहुंच और फाइन-ट्यूनिंग की अनुमति देता है। मॉडल सुरक्षित और कुशल वजन भंडारण के लिए Safetensors का उपयोग करता है। लगभग 2.6 मिलियन डाउनलोड के साथ, यह विश्वसनीय OCR क्षमताओं की आवश्यकता वाले डेवलपर्स के लिए एक लोकप्रिय विकल्प है।

💡मुख्य बातें

├─25 लाख+ डाउनलोड, 1.8 हज़ार पसंद
├─बहुभाषी: zh, en, fr, es, ru
└─एंड-टू-एंड इमेज-टू-टेक्स्ट मॉडल

🎯के लिए

├─डेवलपर्स
├─एआई शोधकर्ता
└─उद्यम

🔗लिंक

└─HuggingFace मॉडल कार्ड