facebook/esm2_t6_8M_UR50D
🧠 AI 모델facebook
생물학적 서열 분석 및 단백질 구조 예측을 위한 경량화된 고성능 단백질 언어 모델입니다.
ESM-2 아키텍처는 단백질 서열에 내재된 진화적 패턴을 학습하기 위해 트랜스포머 기반 모델을 활용하는 계산 생물학의 혁신을 보여줍니다. t6_8M_UR50D 변형은 시리즈 중 가장 작은 모델로, 6개의 트랜스포머 레이어와 800만 개의 파라미터로 구성되어 있습니다. 작은 규모에도 불구하고 UniRef50 데이터셋으로 학습되어 의미 있는 생물학적 표현을 포착할 수 있습니다. 이 모델은 단백질 서열 내 마스킹된 잔기를 예측하는 마스크 언어 모델(Masked Language Model)로 작동하며, 이는 단백질 접힘 및 안정성을 이해하는 데 중요한 역할을 합니다. PyTorch, TensorFlow 및 Safetensors 형식을 지원하여 기존 생물정보학 파이프라인에 최적화되어 통합될 수 있습니다. 가벼운 특성 덕분에 엣지 환경 배포, 고속 대량 스크리닝 및 대규모 모델을 실행하기에 비용이 많이 드는 단백질 공학 작업의 신속한 프로토타이핑에 이상적입니다.
💡하이라이트
- ├─빠른 추론을 위한 8M 파라미터
- ├─6개 트랜스포머 레이어 아키텍처
- └─UniRef50 데이터셋으로 학습
🎯대상
- ├─생물정보학자
- ├─계산 생물학자
- └─단백질 공학자