
yueliu1999/Awesome-Jailbreak-on-LLMs
📦 오픈 소스 프로젝트yueliu1999
LLM 보안을 위한 최신 탈옥(Jailbreak) 연구, 데이터셋 및 평가 도구를 집대성한 종합 저장소입니다.
Awesome-Jailbreak-on-LLMs는 급변하는 LLM 적대적 강건성 분야를 구조적으로 정리한 프로젝트입니다. 프롬프트 엔지니어링, 사회 공학적 공격부터 경사 기반 최적화 및 자동화된 레드팀 활동에 이르기까지 다양한 탈옥 기법을 분류하여 제공합니다. 모델의 안전 가드레일을 우회하는 취약점을 분석할 수 있는 도구와 벤치마크를 제공함으로써, 모델 개발자와 공격자 간의 기술적 공방을 깊이 있게 이해하도록 돕습니다. 텍스트 기반 LLM뿐만 아니라 멀티모달 아키텍처인 VLM까지 아우르며, 보안 전문가들이 최신 위협 트렌드를 파악하고 더욱 탄력적이고 신뢰할 수 있는 AI 시스템을 구축할 수 있도록 지원합니다.
💡하이라이트
- ├─최신 SOTA 탈옥 연구 자료 큐레이션
- ├─다양한 데이터셋 및 평가 도구 포함
- └─LLM 및 VLM 보안 위협 전반 포괄
🎯대상
- ├─AI 보안 연구원
- ├─레드팀 전문가
- └─LLM 개발자