facebook/esm2_t12_35M_UR50D
🧠 एआई मॉडलfacebook
जैविक अनुक्रम विश्लेषण और संरचना भविष्यवाणी के लिए एक उच्च-प्रदर्शन प्रोटीन भाषा मॉडल।
esm2_t12_35M_UR50D मॉडल प्रोटीन अनुक्रम प्रतिनिधित्व के लिए अनुकूलित एक विशेष ट्रांसफॉर्मर आर्किटेक्चर है। 12 परतों और 35 मिलियन पैरामीटर के साथ, यह कम्प्यूटेशनल दक्षता और भविष्य कहनेवाला क्षमता के बीच एक आदर्श संतुलन बनाता है। UniRef50 डेटासेट पर प्रशिक्षित, यह मॉडल अमीनो एसिड अनुक्रमों के भीतर एन्कोड किए गए गहरे विकासवादी पैटर्न को सीखता है। यह मुख्य रूप से एक मास्क्ड लैंग्वेज मॉडल के रूप में कार्य करता है, जहां यह अनुक्रम में गायब अवशेषों (residues) की भविष्यवाणी करता है, जो प्रोटीन के संरचनात्मक और कार्यात्मक बाधाओं को प्रभावी ढंग से कैप्चर करता है। यह मॉडल Hugging Face ट्रांसफॉर्मर लाइब्रेरी के साथ पूरी तरह से संगत है और PyTorch, TensorFlow तथा Safetensors प्रारूपों का समर्थन करता है। इसका आर्किटेक्चर विशेष रूप से जैविक डेटा के लिए तैयार किया गया है, जो इसे प्रोटीन फोल्डिंग भविष्यवाणी, वेरिएंट प्रभाव भविष्यवाणी और प्रोटीन इंजीनियरिंग जैसे कार्यों के लिए एक आवश्यक घटक बनाता है। विशाल प्रोटीन डेटाबेस पर स्व-पर्यवेक्षित शिक्षण का लाभ उठाकर, यह उच्च गुणवत्ता वाले एम्बेडिंग प्रदान करता है जिन्हें विशेष जैविक अनुसंधान कार्यों के लिए फाइन-ट्यून किया जा सकता है।
💡मुख्य बातें
- ├─35M पैरामीटर प्रोटीन ट्रांसफॉर्मर
- ├─UniRef50 डेटासेट पर प्रशिक्षित
- └─फिल-मास्क कार्यों के लिए अनुकूलित
🎯के लिए
- ├─बायोइनफॉरमैटिशियन
- ├─कम्प्यूटेशनल जीवविज्ञानी
- └─एआई शोधकर्ता