Anthropic推出了Claude 2,这是一种在编码、数学和推理任务方面表现出色的先进大型语言模型(LLM)。
Claude 2旨在模拟与一个有帮助的同事或个人助理的对话,最新版本经过精确调整,以提供更好的用户体验,具有增强的对话能力、更清晰的解释、减少有害输出的产生以及扩展的记忆力。
在编码熟练度方面,Claude 2超越了其前身,并在Codex HumanEval Python编程测试中获得了更高的分数。通过GSM8k评估的解决小学数学问题的能力也有显著改善。
Sourcegraph的首席执行官兼联合创始人Quinn Slack表示:“对于AI编码来说,开发人员需要快速可靠地获取有关其独特代码库的上下文信息,以及具有大上下文窗口和强大常规推理能力的强大LLM。”
“开发工作流程中最慢和最令人沮丧的部分正在变得更快更愉快,多亏了Claude 2,Cody正在帮助更多开发人员构建更多推动世界发展的软件。”
Claude 2引入了扩展的输入和输出长度功能,使其能够处理最多100,000个标记的提示。这一增强功能使模型能够分析长文档,如技术指南或整本书,并生成更长的作品。
“我们非常高兴成为首批向客户提供Claude 2的公司之一,通过与Anthropic等伙伴关系,为客户带来强化的语义、最新知识培训、对复杂提示的改进推理以及无缝地与3倍更大的上下文窗口的现有内容重新混合的能力。”Jasper的工程副总裁Greg Larson表示。
Anthropic已努力最大限度地减少Claude 2生成有害或冒犯性输出的情况。虽然衡量这些品质很具挑战性,但内部评估显示,与其前身Claude 1.3相比,Claude 2在提供无害响应方面的效果提高了一倍。
Anthropic承认,虽然Claude 2可以分析复杂的作品,但要意识到语言模型的局限性。用户应谨慎行事,不要将其作为事实参考。相反,应将Claude 2用于处理由已经对主题有所了解并能验证结果的用户提供的数据。