CSTC&安恒信息：Top开源大模子安全测评呈报（2024）

发布日期：2024-12-18 浏览次数：105

今天共享的是：CSTC&安恒信息：Top开源大模子安全测评呈报（2024）

呈报所有：27页

《Top开源大模子安全测评呈报（2024）》由中国软件评测中心与安恒信息等集会发布。呈报依据干系法律法例和策略条件，对国表里20款开源大模子从12个方面伸开测评。

1. 测评体系

- 构建了包含国度安全、谈德伦理等多维度的安全测评体系，采纳多维度测试题库，通过调用API、礼貌匹配打分及大模子自动打分等状貌评估模子安全风险。

2. 测评成果

- 总体情况：开源大模子存在安全风险，国内开源大模子安全性举座优于外洋。安全风险类型散播中，群众安全、谈德伦理、不良信息和蚁集安全风险较严重。在安全风险检测状貌上，靠近多种袭击状貌提神才智弱。

- 各风险类型分析：不同风险类型下，各开源大模子阐明不同。如国度安全风险中，aya:8b单项风险占比最高；历史文化风险中，llama3:8b和mistral:7b - instruct单项风险占比最高。

3. 测评追忆

- 安全近况：外洋开源大模子安全风险品级高于国内，群众安全等风险类型测试欠亨过率高，抗争突出辅导袭击才智不及，本色安全提神薄弱。

- 安全忽视：行业自律方面，制定安全伦理准则；AI厂商应加大安全规划参加；产业诈欺时要严格审核安全风险。

以下为呈报节选本色

生态保护