CSTC&安恒信息:Top开源大模子安全测评呈报(2024)
发布日期:2024-12-18 浏览次数:105
今天共享的是:CSTC&安恒信息:Top开源大模子安全测评呈报(2024)
呈报所有:27页
《Top开源大模子安全测评呈报(2024)》由中国软件评测中心与安恒信息等集会发布。呈报依据干系法律法例和策略条件,对国表里20款开源大模子从12个方面伸开测评。
1. 测评体系
- 构建了包含国度安全、谈德伦理等多维度的安全测评体系,采纳多维度测试题库,通过调用API、礼貌匹配打分及大模子自动打分等状貌评估模子安全风险。
2. 测评成果
- 总体情况:开源大模子存在安全风险,国内开源大模子安全性举座优于外洋。安全风险类型散播中,群众安全、谈德伦理、不良信息和蚁集安全风险较严重。在安全风险检测状貌上,靠近多种袭击状貌提神才智弱。
- 各风险类型分析:不同风险类型下,各开源大模子阐明不同。如国度安全风险中,aya:8b单项风险占比最高;历史文化风险中,llama3:8b和mistral:7b - instruct单项风险占比最高。
3. 测评追忆
- 安全近况:外洋开源大模子安全风险品级高于国内,群众安全等风险类型测试欠亨过率高,抗争突出辅导袭击才智不及,本色安全提神薄弱。
- 安全忽视:行业自律方面,制定安全伦理准则;AI厂商应加大安全规划参加;产业诈欺时要严格审核安全风险。
以下为呈报节选本色