yuvalkirstain/PickScore_v1

🧠 एआई मॉडलyuvalkirstain

CLIP पर आधारित शून्य-शॉट इमेज-टेक्स्ट स्कोरिंग मॉडल, Pick-a-Pic डेटासेट पर प्रशिक्षित।

PickScore_v1 एक शून्य-शॉट इमेज वर्गीकरण मॉडल है जो एक स्कोर आउटपुट करता है जो दर्शाता है कि एक टेक्स्ट किसी इमेज का कितना अच्छा वर्णन करता है। यह CLIP आर्किटेक्चर का लाभ उठाता है और मानव प्राथमिकताओं को कैप्चर करने के लिए Pick-a-Pic डेटासेट (arxiv:2305.01569) पर प्रशिक्षित है। मॉडल PyTorch के साथ कार्यान्वित है, safetensors का उपयोग करता है, और HuggingFace एंडपॉइंट के साथ संगत है, जिससे इसे तैनात करना आसान है। इसकी उच्च डाउनलोड संख्या (1.7M) और 52 लाइक स्वचालित इमेज मूल्यांकन, कैप्शन गुणवत्ता स्कोरिंग और डेटासेट फ़िल्टरिंग जैसे कार्यों में इमेज-टेक्स्ट संरेखण का मूल्यांकन करने में इसकी उपयोगिता को दर्शाते हैं।

💡मुख्य बातें

├─शून्य-शॉट इमेज-टेक्स्ट स्कोरिंग
├─HuggingFace पर 1.7M+ डाउनलोड
└─Pick-a-Pic डेटासेट पर प्रशिक्षित

🎯के लिए

├─मशीन लर्निंग शोधकर्ता
├─एआई डेवलपर
└─सामग्री निर्माता

🔗लिंक

└─HuggingFace मॉडल पेज