首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

又一家机器人技术公司完成2800万美元B轮融资 特斯拉德国否认柏林工厂大幅裁员,称员工数量与产能保持稳定 地位互换!长安两大合资,冰火两重天 2025年汽车集团乘用车累计销量排行 比亚迪稳居榜首 新势力增速瞩目 新势力车企,如何打“渠道战”? 浙大教授带队,这家人形机器人公司刚拿下4.5亿融资 三菱汽车任命前美洲区高管为新任总裁 年度冠军易主?宇树官宣人形机器人出货超5500台,或反超智元 宝马新世代M系列纯电车型明年问世 iM3将搭载四电机 谷歌Pixel 10a手机渲染图及规格曝光:提供128/256G存储,起售价500欧元 固态电池有国标了 但想买的兄弟还是歇歇吧 特斯拉在美推2026款7座Model Y,免费升级多项配置 约3000名沃尔沃电车车主被警告:不要充满电 本土车企竞争不过!欧洲计划为中国电动汽车设定最低售价 以取代关税政策 手机靠近就能解锁,苹果及多家车企参与汽车数字钥匙4.0标准测试 雷军回应小米SU7二手车行情 保值率80.1%处于行业头部水平 上汽奥迪将携全系豪华阵容亮相2025广州车展 世界家轿 中国帝豪!第5代帝豪上市 限时感恩价6.59万元起 TE Connectivity | 汽车域控制器的「四重剑境」 Mobileye陈允香:Mobileye是中国车企出海的天然优选 半年完成三轮融资,加速进化再获资本加码 从无形IP到AI万象,安谋科技Arm China“周易”X3 NPU 发布! 地瓜机器人与傅利叶达成合作 吉利银河V900官宣:11月21日全球首秀 英媒:iPhone Air销量仅苹果预期三分之一 创新败给了实用性 百万粉丝大V,“栽”在1800亿王传福手上 上汽集团2027年正式实现全固态电池的量产交付 AI Agent将彻底改变人机交互方式,并颠覆整个软件行业 480亿新势力首富,小鹏汽车终于要“熬出头”了 iOS微信发布8.0.66测试版,苹果iOS 14系统用户将彻底被淘汰