Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5

AiSiri网11月7日消息,国产AI新锐月之暗面今日宣布,其最新的大语言模型Kimi K2 Thinking正式上线,号称是Kimi系列迄今为止最强悍的版本。目前,该模型已部署在kimi.com以及最新版Kimi App的常规对话模式中。

据官方介绍,Kimi K2 Thinking 最大的亮点在于其“边思考,边使用工具”的原生能力。简单来讲,就是这货不仅会动脑子,还会自己上网查资料、用工具辅助分析,省去了人工操作的麻烦。而且在一些难度颇高的基准测试中,比如“人类最后的考试(Humanity’s Last Exam)”、“自主网络浏览能力(BrowseComp)”以及“复杂信息收集推理(SEAL-0)”,Kimi K2 Thinking的表现都达到了业界领先水平。

值得关注的是,Kimi K2 Thinking号称可以**无需人工干预,自主进行高达300轮的工具调用和持续思考**。这意味着啥?意味着它在处理复杂问题时,能够像一个不知疲倦的专业研究员,不断地挖掘信息、分析数据,最终得出结论。这对于需要大量信息整理和分析的行业来说,无疑是一大利好。

以“人类最后的考试”为例,这项测试涵盖了超过100个专业领域,堪称AI界的“高考”。在允许使用工具的情况下,Kimi K2 Thinking取得了44.9%的成绩。虽说离满分还远,但考虑到考试的难度,这个表现已经相当亮眼了。

再来看BrowseComp,这是OpenAI推出的一个专门评估AI网络浏览能力的基准测试。Kimi K2 Thinking 在这项测试中拿下了 60.2% 的成绩,相比之下,人类的平均水平只有29.2%。这说明在信息检索和处理方面,Kimi K2 Thinking 已经超越了很多人类专家。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行二次审核删除:fireflyrqh@163.com。
Like (0)
Previous 2025年11月7日 上午12:22
Next 2025年11月7日 上午2:24

相关推荐