首页 > 活动线报 > 每日福利 > 谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

发布时间:2024-06-02 22:12:46来源: 15210273549

刚刚,谷歌DeepMind、JHU、牛津等发布研究,证实GPT-4的心智理论已经完全达到成年人类水平,在更复杂的第6阶推理上,更是大幅超越人类!此前已经证实,GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被LLM甩在后面了。

 

GPT-4的高阶心智理论(ToM),已经正式超越人类!

就在刚刚,谷歌DeepMind、约翰斯·霍普金斯大学和牛津大学等机构的学者发布的研究证实,GPT-4在心智理论任务上的表现,已经完全达到了成年人类的水平。

而且,它在第6阶推理上的表现,更是大幅超过了人类!


论文地址:https://arxiv.org/pdf/2405.18870

无独有偶,此前Nature子刊《自然·人类行为》的一项研究也证实了,GPT-4在心智理论上的表现已经位于人类水平之上,能够比人类更好地察觉出言语中的讽刺和暗示。如果你不这么觉得,那它大概率只是在隐藏实力而已。

总之,这前后脚的两项研究清晰地表明,如今表现最好的大语言模型,已经发展出广义的心智理论能力,而GPT-4,已经是其中的佼佼者。


所以,距离各位LLM用心智和权术把我们人类玩弄于股掌之间的那一天,还有多远?


高阶心智理论

 

这次的研究,探讨了LLM究竟能在多大程度上发展高阶心智理论(higher-order ToM)。

所谓高阶心智理论,就是人类以递归方式,推理他人的多种心理和情感状态的能力。

比如,「我认为你相信她知道」这句话中,就包含了非常复杂的多层推理,属于一个三阶陈述。

在以前,大部分相关研究,都集中在二阶ToM上。


用什么样的方法,能衡量出LLM对如此复杂问题的把握能力?

团队特意引入了一套手写测试套件——多阶心智理论问答测试。

而参与PK的选手,有5个LLM和一大群成年人。

 

每日福利更多>>

极致续航补能+高阶智驾再远也无忧,春节自驾归家首选昊铂HT 大溜背C级车,轴距超2.9m,配置升级,增程/纯电可选,13.46万起 全新一代丰田荣放谍照曝光,延续家用定位,有消息称取消燃油版 开年就摘得周销冠,吉利银河星舰7都做对了什么 30万就能买宝马i5,为什么还要看更贵的腾势Z9? 欧洲汽车行业进一步滑向凛冬 开了几十款新车的肺腑之言:买新能源车,这3个“底线”不能破 2024年度盘点:活得好的不止比亚迪 雷军官宣:小米汽车工厂开放参观,名额有限,你准备好了吗? 2024汽车销量榜单出炉,比亚迪特斯拉等谁领风骚? 年销217万辆达历史新高,内卷之下吉利增长的奥秘是什么? 上市造车新势力:2024连破纪录,2025不再激进? 2025年三款新能源SUV来袭,智能颜值双在线,你准备好了吗? 智驾“新基建”浪潮:IP、EDA与云计算三件套,走向刚需 年销量破200万辆!广汽集团去年连续6个月环比增长 小米汽车工厂开放参观预约,雷军:每周六限20组,你准备好了吗? 首发华为四大黑科技,售24.98-28.98万元,智界R7增程版上市 限时售价13.59-15.09万元,适合年轻消费群体的领克Z20 拳打理想L6脚踢问界M7 有了增程的智界R7月销要稳定破万! 技术与设计双突破,蔚来ET9自研创新,引领智能行政出行新时代 江淮瑞风RF8 PHEV鸿蒙版:华为智慧屏+强劲混动,驾驶体验全面升级 15万级“性价比黑马”来了,“金标大众”配置拉满 2025款MG7上市,MG要如何反弹? 全球第三大车企将诞生,但其目标或很难实现 2024年海南定安县公安局招聘辅警25人公告 2024年湖南长沙市委金融委员会办公室招聘中级雇员公告 2025年湖南岳阳市中心医院招聘公告 2024年湖南邵阳市公路建设养护中心所属公益一类事业单位选调文秘工作人员公告 2024年湖南浏阳市招聘卫健系统专业人才15人公告 2025年辽宁朝阳市教育局直属学校赴高校招聘教师70人公告