首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

小鹏G9限时优惠,至高减免6W,特斯拉时代已经过去? 比亚迪“天神之眼”重磅升级!无图城市领航功能全国开通! 小米SU7掉落山崖一家人安然无恙 事故竟成小米带货现场? 诚意十足!本次零跑C11的OTA都有哪些亮点? 80亿增资落地,北京现代加速布局“在中国 为全球”战略 坚守紧凑级豪华,奥迪A3都做了什么 年至不惑,上汽大众,在改革中诞生,在变革中引领 『网红』难过一周期,『流量』难撑六十年,丰田的持久之道 2024年湖南长沙市发展和改革委员会招聘中级雇员公告 2025年湖南财经工业职业技术学院_衡阳财经工业学院人才引进26人公告 2024年湖南怀化市总工会属事业单位招聘和选调5人公告 2024年湖南衡阳市雁峰区事业单位急需紧缺人才引进6人公告 2024下半年广东肇庆市端州区教育局招聘中小学教师13人公告 2024年中国医科大学招聘高层次和急需紧缺人才公告 广东珠海市妇幼保健院面向2025年应届生招聘所属事业单位工作人员23人公告 2024年山西临汾市第一实验中学引进高层次急需紧缺岗位人才公告 广东珠海市卫生健康局面向2025年应届生招聘所属公立医院工作人员69人公告 小鹏G9史上最大钜惠至高6W元,智电SUV购车首选就它了! 广汽集团5年10亿美元投融巴西,7款新车型即将上市 保时捷为中国区任命新首席运营官 梅赛德斯-奔驰最新L3级自动驾驶系统在德国获批 特斯拉新车计算机被曝出现重大故障 工信部优化车联网频谱 广汽长安布局飞行汽车 奥迪一汽新能源投产 华为余承东直播揭秘:鸿蒙智行合作新车动态 苹果考虑将腾讯字节AI模型嵌入iPhone 台湾省11月车型销量榜:日系车成最爱 前十独占八席 2024年浙江省交通工程管理中心招聘人员公告 2024年阳新县第三批事业单位选聘工作人员公告(7人) 2024年台州市三门县人民医院医共体分院招聘编外工作人员公告 2025年苏州昆山市卫生健康系统赴医学高校选聘医卫生专业高层次人才公告