toxy4ny/redteam-ai-benchmark

📦 开源项目toxy4ny

专为评估无审查大模型在进攻性安全任务中的能力与边界而设计的基准测试套件。

Red Team AI Benchmark 为安全研究人员和 AI 开发者提供了一个全面的测试环境。随着无审查模型的普及，理解其被滥用的可能性及在进攻性安全操作中的效用至关重要。该仓库提供了一套专门用于探测大模型边界的测试用例和评估指标。核心功能包括自动化的提示词调优工作流、基于 RAG 的聊天机器人漏洞评估，以及专门用于测试黑客攻击能力的模块。该工具基于 Python 构建，具有高度的可扩展性，方便研究人员集成自定义的红队数据集或特定的攻击向量。通过聚焦 MLSecOps 与进攻性安全的交叉领域，它弥合了传统渗透测试与现代 AI 安全研究之间的鸿沟，从而能够更严谨地评估模型抵御对抗性输入的能力。

💡核心亮点

├─专门评估无审查大模型的安全性
├─内置自动化红队测试工作流
└─专注于进攻性安全任务场景

🎯适用人群

├─网络安全研究员
├─AI 安全工程师
└─MLSecOps 从业者

🔗链接

└─GitHub 仓库