苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

AiSiri网6月8日消息:苹果近日发布一篇内部研究报告,直指当前炙手可热的AI推理模型,包括DeepSeek、o3-mini,乃至最新的Claude 3.7,可能并未真正展现出“思考”能力,而仅仅是更高级的“模式匹配”。一石激起千层浪,科技圈再次围绕AI本质展开激烈讨论。

苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

据了解,苹果的团队察觉到,目前主流的AI评估方式,过度依赖数学和编程的既定标准,着重于模型能否给出正确答案,但并未深入分析其“思考过程”。他们认为,模型可能只是凭借记忆,直接调用训练时见过的类似题目答案。

为了更全面地考察模型的推理能力,苹果团队设计了汉诺塔、跳棋交换、过河问题、积木世界四类可控难度的谜题。这些谜题能够精确控制复杂度,从而更客观地衡量AI的推理能力。

研究结果显示,随着谜题难度升级,AI模型的“思考”深度并未随之加深。模型最初会尝试延长“思考”时间,但随后便迅速放弃深入探索。即使有充足的token预算,模型也往往浅尝辄止,拒绝进一步挖掘问题。

更有甚者,当问题复杂度超过某个临界点时,无论推理模型还是传统模型,都将遭遇性能断崖式下跌,准确率直线归零。犹如一辆豪华跑车,面对崎岖山路,直接熄火趴窝。

这篇论文的发布时间点颇为微妙。就在不久前的WWDC大会上,苹果正式推出了其AI战略Apple Intelligence。然而,该战略中的部分功能已被曝出延期、功能不完善,甚至直接下架。因此,有评论指出,苹果此举有“自己尚未取得突破,便急于否定他人成果”之嫌。

当然,也有分析认为,苹果的这篇论文并非全盘否定,而是呼吁业界设立更完善的推理机制和评估方法,从而推动AI技术朝着更加务实、更具真正“思考”能力的方向发展。这场关于AI“真伪”的讨论,或许将成为AI发展道路上的一个重要转折点。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行二次审核删除:fireflyrqh@163.com。
Like (0)
Previous 2025年6月8日 下午2:06
Next 2025年6月8日 下午8:53

相关推荐