
th1nhhdk/local_ai_ocr
📦 ओपन सोर्स प्रोजेक्टth1nhhdk
DeepSeek-OCR का उपयोग करके छवियों और PDF को स्थानीय रूप से प्रोसेस करने वाला एक पोर्टेबल, ऑफलाइन OCR समाधान।
local_ai_ocr एक विशेष पायथन-आधारित सॉफ़्टवेयर है जिसे स्थानीय वातावरण में उच्च-प्रदर्शन OCR क्षमताएं लाने के लिए डिज़ाइन किया गया है। DeepSeek-OCR को एकीकृत करके, यह इंटरनेट-कनेक्टेड दस्तावेज़ प्रसंस्करण सेवाओं की आवश्यकता को समाप्त करता है, जिससे प्रारंभिक मॉडल सेटअप के बाद पूर्ण डेटा गोपनीयता और ऑफलाइन कार्यक्षमता सुनिश्चित होती है। यह टूल पोर्टेबल होने के लिए इंजीनियर किया गया है, जो इसे उन उपयोगकर्ताओं के लिए उपयुक्त बनाता है जिन्हें एयर-गैप्ड सिस्टम या सुरक्षित स्थानीय वर्कस्टेशन पर दस्तावेज़ डिजिटलीकरण करने की आवश्यकता होती है। यह मानक छवि फ़ाइलों और बहु-पृष्ठ PDF सहित विभिन्न इनपुट स्वरूपों का समर्थन करता है, और उच्च सटीकता के साथ टेक्स्ट की व्याख्या करने के लिए स्थानीय LLM अनुमान का लाभ उठाता है। यह प्रोजेक्ट अत्यधिक मॉड्यूलर है, जो डेवलपर्स को अपने स्वयं के पाइपलाइनों में स्थानीय OCR वर्कफ़्लो को एकीकृत करने की अनुमति देता है, और यह बहुभाषी टेक्स्ट पहचान का समर्थन करता है, जो इसे वैश्विक दस्तावेज़ प्रबंधन कार्यों के लिए एक बहुमुखी संपत्ति बनाता है।
💡मुख्य बातें
- ├─100% ऑफलाइन दस्तावेज़ प्रसंस्करण
- ├─छवियों और PDF फ़ाइलों का समर्थन
- └─पोर्टेबल पायथन-आधारित आर्किटेक्चर
🎯के लिए
- ├─गोपनीयता के प्रति जागरूक पेशेवर
- ├─डेटा इंजीनियर
- └─शोधकर्ता