facebook/esm2_t12_35M_UR50D
🧠 AI 模型facebook
一款用于生物序列分析和结构预测的高性能蛋白质语言模型。
esm2_t12_35M_UR50D 模型是一种专门针对蛋白质序列表示进行优化的 Transformer 架构。它拥有 12 层网络和 3500 万参数,在计算效率与预测能力之间取得了理想的平衡。该模型在 UniRef50 数据集上进行训练,学习氨基酸序列中蕴含的深层进化模式。它主要作为掩码语言模型运行,通过预测序列中缺失的残基,有效捕捉蛋白质的结构和功能约束。该模型完全兼容 Hugging Face Transformers 库,支持 PyTorch、TensorFlow 和 Safetensors 格式。其架构专为生物数据调优,是蛋白质折叠预测、变异效应预测和蛋白质工程等任务的核心组件。通过在海量蛋白质数据库上进行自监督学习,它能够提供高质量的嵌入向量,并可针对特定的生物研究任务进行微调。
💡核心亮点
- ├─3500万参数蛋白质 Transformer
- ├─基于 UniRef50 数据集训练
- └─针对掩码填充任务深度优化
🎯适用人群
- ├─生物信息学家
- ├─计算生物学家
- └─AI 研究人员