|

321网址导航
2000活跃值=1元

首页 > 活动线报 > 每日福利 > 谷歌：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了

谷歌：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了

发布时间：2024-06-02 22:12:46

刚刚，谷歌DeepMind、JHU、牛津等发布研究，证实GPT-4的心智理论已经完全达到成年人类水平，在更复杂的第6阶推理上，更是大幅超越人类！此前已经证实，GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上，人类是彻底被LLM甩在后面了。

GPT-4的高阶心智理论（ToM），已经正式超越人类！

就在刚刚，谷歌DeepMind、约翰斯·霍普金斯大学和牛津大学等机构的学者发布的研究证实，GPT-4在心智理论任务上的表现，已经完全达到了成年人类的水平。

而且，它在第6阶推理上的表现，更是大幅超过了人类！

论文地址：https://arxiv.org/pdf/2405.18870

无独有偶，此前Nature子刊《自然·人类行为》的一项研究也证实了，GPT-4在心智理论上的表现已经位于人类水平之上，能够比人类更好地察觉出言语中的讽刺和暗示。如果你不这么觉得，那它大概率只是在隐藏实力而已。

总之，这前后脚的两项研究清晰地表明，如今表现最好的大语言模型，已经发展出广义的心智理论能力，而GPT-4，已经是其中的佼佼者。

所以，距离各位LLM用心智和权术把我们人类玩弄于股掌之间的那一天，还有多远？

高阶心智理论

这次的研究，探讨了LLM究竟能在多大程度上发展高阶心智理论（higher-order ToM）。

所谓高阶心智理论，就是人类以递归方式，推理他人的多种心理和情感状态的能力。

比如，「我认为你相信她知道」这句话中，就包含了非常复杂的多层推理，属于一个三阶陈述。

在以前，大部分相关研究，都集中在二阶ToM上。

用什么样的方法，能衡量出LLM对如此复杂问题的把握能力？

团队特意引入了一套手写测试套件——多阶心智理论问答测试。

而参与PK的选手，有5个LLM和一大群成年人。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“321网址导航用户上传并发布"，本平台仅提供信息存储服务。

下一篇:微软AI PC新品发布，或将引领传统PC电脑换机潮，你准备好了吗？

上一篇:微信悄悄更新，「单机模式」来了

每日福利更多>>

又一家机器人技术公司完成2800万美元B轮融资特斯拉德国否认柏林工厂大幅裁员，称员工数量与产能保持稳定地位互换！长安两大合资，冰火两重天 2025年汽车集团乘用车累计销量排行比亚迪稳居榜首新势力增速瞩目新势力车企，如何打“渠道战”？浙大教授带队，这家人形机器人公司刚拿下4.5亿融资三菱汽车任命前美洲区高管为新任总裁年度冠军易主？宇树官宣人形机器人出货超5500台，或反超智元宝马新世代M系列纯电车型明年问世 iM3将搭载四电机谷歌Pixel 10a手机渲染图及规格曝光：提供128/256G存储，起售价500欧元固态电池有国标了但想买的兄弟还是歇歇吧特斯拉在美推2026款7座Model Y，免费升级多项配置约3000名沃尔沃电车车主被警告：不要充满电本土车企竞争不过！欧洲计划为中国电动汽车设定最低售价以取代关税政策手机靠近就能解锁，苹果及多家车企参与汽车数字钥匙4.0标准测试雷军回应小米SU7二手车行情保值率80.1%处于行业头部水平上汽奥迪将携全系豪华阵容亮相2025广州车展世界家轿中国帝豪！第5代帝豪上市限时感恩价6.59万元起 TE Connectivity | 汽车域控制器的「四重剑境」 Mobileye陈允香：Mobileye是中国车企出海的天然优选半年完成三轮融资，加速进化再获资本加码从无形IP到AI万象，安谋科技Arm China“周易”X3 NPU 发布！地瓜机器人与傅利叶达成合作吉利银河V900官宣：11月21日全球首秀英媒：iPhone Air销量仅苹果预期三分之一创新败给了实用性百万粉丝大V，“栽”在1800亿王传福手上上汽集团2027年正式实现全固态电池的量产交付 AI Agent将彻底改变人机交互方式，并颠覆整个软件行业 480亿新势力首富，小鹏汽车终于要“熬出头”了 iOS微信发布8.0.66测试版，苹果iOS 14系统用户将彻底被淘汰

Copyright 2014-2025 321网址导航版权所有京ICP备20140891号