yuvalkirstain/PickScore_v1

🧠 AI 모델yuvalkirstain

CLIP 기반의 제로샷 이미지-텍스트 점수 모델, Pick-a-Pic 데이터셋으로 훈련됨.

PickScore_v1은 텍스트가 이미지를 얼마나 잘 설명하는지 점수를 출력하는 제로샷 이미지 분류 모델입니다. CLIP 아키텍처를 활용하고 Pick-a-Pic 데이터셋(arxiv:2305.01569)으로 훈련되어 인간의 선호도를 포착합니다. PyTorch로 구현되었으며 safetensors를 사용하고 HuggingFace 엔드포인트와 호환되어 배포가 용이합니다. 170만 회의 높은 다운로드 수와 52개의 좋아요는 자동 이미지 평가, 캡션 품질 점수 매기기, 데이터셋 필터링과 같은 작업에서 이미지-텍스트 정렬을 평가하는 데 유용함을 반영합니다.

💡하이라이트

├─제로샷 이미지-텍스트 점수 모델
├─HuggingFace 170만+ 다운로드
└─Pick-a-Pic 데이터셋 훈련

🎯대상

├─머신러닝 연구자
├─AI 개발자
└─콘텐츠 제작자

🔗링크

└─HuggingFace 모델 페이지