AiSiri网11月7日消息,国产AI新锐月之暗面今日宣布,其最新的大语言模型Kimi K2 Thinking正式上线,号称是Kimi系列迄今为止最强悍的版本。目前,该模型已部署在kimi.com以及最新版Kimi App的常规对话模式中。
据官方介绍,Kimi K2 Thinking 最大的亮点在于其“边思考,边使用工具”的原生能力。简单来讲,就是这货不仅会动脑子,还会自己上网查资料、用工具辅助分析,省去了人工操作的麻烦。而且在一些难度颇高的基准测试中,比如“人类最后的考试(Humanity’s Last Exam)”、“自主网络浏览能力(BrowseComp)”以及“复杂信息收集推理(SEAL-0)”,Kimi K2 Thinking的表现都达到了业界领先水平。
值得关注的是,Kimi K2 Thinking号称可以**无需人工干预,自主进行高达300轮的工具调用和持续思考**。这意味着啥?意味着它在处理复杂问题时,能够像一个不知疲倦的专业研究员,不断地挖掘信息、分析数据,最终得出结论。这对于需要大量信息整理和分析的行业来说,无疑是一大利好。
以“人类最后的考试”为例,这项测试涵盖了超过100个专业领域,堪称AI界的“高考”。在允许使用工具的情况下,Kimi K2 Thinking取得了44.9%的成绩。虽说离满分还远,但考虑到考试的难度,这个表现已经相当亮眼了。
再来看BrowseComp,这是OpenAI推出的一个专门评估AI网络浏览能力的基准测试。Kimi K2 Thinking 在这项测试中拿下了 60.2% 的成绩,相比之下,人类的平均水平只有29.2%。这说明在信息检索和处理方面,Kimi K2 Thinking 已经超越了很多人类专家。


