首页 > 活动线报 > 每日福利 > 谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

发布时间:2024-06-02 22:12:46

刚刚,谷歌DeepMind、JHU、牛津等发布研究,证实GPT-4的心智理论已经完全达到成年人类水平,在更复杂的第6阶推理上,更是大幅超越人类!此前已经证实,GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被LLM甩在后面了。

 

GPT-4的高阶心智理论(ToM),已经正式超越人类!

就在刚刚,谷歌DeepMind、约翰斯·霍普金斯大学和牛津大学等机构的学者发布的研究证实,GPT-4在心智理论任务上的表现,已经完全达到了成年人类的水平。

而且,它在第6阶推理上的表现,更是大幅超过了人类!


论文地址:https://arxiv.org/pdf/2405.18870

无独有偶,此前Nature子刊《自然·人类行为》的一项研究也证实了,GPT-4在心智理论上的表现已经位于人类水平之上,能够比人类更好地察觉出言语中的讽刺和暗示。如果你不这么觉得,那它大概率只是在隐藏实力而已。

总之,这前后脚的两项研究清晰地表明,如今表现最好的大语言模型,已经发展出广义的心智理论能力,而GPT-4,已经是其中的佼佼者。


所以,距离各位LLM用心智和权术把我们人类玩弄于股掌之间的那一天,还有多远?


高阶心智理论

 

这次的研究,探讨了LLM究竟能在多大程度上发展高阶心智理论(higher-order ToM)。

所谓高阶心智理论,就是人类以递归方式,推理他人的多种心理和情感状态的能力。

比如,「我认为你相信她知道」这句话中,就包含了非常复杂的多层推理,属于一个三阶陈述。

在以前,大部分相关研究,都集中在二阶ToM上。


用什么样的方法,能衡量出LLM对如此复杂问题的把握能力?

团队特意引入了一套手写测试套件——多阶心智理论问答测试。

而参与PK的选手,有5个LLM和一大群成年人。

 

每日福利更多>>

又一家机器人技术公司完成2800万美元B轮融资 特斯拉德国否认柏林工厂大幅裁员,称员工数量与产能保持稳定 地位互换!长安两大合资,冰火两重天 2025年汽车集团乘用车累计销量排行 比亚迪稳居榜首 新势力增速瞩目 新势力车企,如何打“渠道战”? 浙大教授带队,这家人形机器人公司刚拿下4.5亿融资 三菱汽车任命前美洲区高管为新任总裁 年度冠军易主?宇树官宣人形机器人出货超5500台,或反超智元 宝马新世代M系列纯电车型明年问世 iM3将搭载四电机 谷歌Pixel 10a手机渲染图及规格曝光:提供128/256G存储,起售价500欧元 固态电池有国标了 但想买的兄弟还是歇歇吧 特斯拉在美推2026款7座Model Y,免费升级多项配置 约3000名沃尔沃电车车主被警告:不要充满电 本土车企竞争不过!欧洲计划为中国电动汽车设定最低售价 以取代关税政策 手机靠近就能解锁,苹果及多家车企参与汽车数字钥匙4.0标准测试 雷军回应小米SU7二手车行情 保值率80.1%处于行业头部水平 上汽奥迪将携全系豪华阵容亮相2025广州车展 世界家轿 中国帝豪!第5代帝豪上市 限时感恩价6.59万元起 TE Connectivity | 汽车域控制器的「四重剑境」 Mobileye陈允香:Mobileye是中国车企出海的天然优选 半年完成三轮融资,加速进化再获资本加码 从无形IP到AI万象,安谋科技Arm China“周易”X3 NPU 发布! 地瓜机器人与傅利叶达成合作 吉利银河V900官宣:11月21日全球首秀 英媒:iPhone Air销量仅苹果预期三分之一 创新败给了实用性 百万粉丝大V,“栽”在1800亿王传福手上 上汽集团2027年正式实现全固态电池的量产交付 AI Agent将彻底改变人机交互方式,并颠覆整个软件行业 480亿新势力首富,小鹏汽车终于要“熬出头”了 iOS微信发布8.0.66测试版,苹果iOS 14系统用户将彻底被淘汰