AiSiri网8月21日消息,今天,DeepSeek宣布正式发布DeepSeek-V3.1,官方称这是迈向Agent时代的第一步。

这次升级,DeepSeek 主要干了这几件事:
*
左右互搏的混合推理架构:一个模型既能“深思熟虑”,又能“秒答”,随时切换,灵活应对各种场景。这有点像手机的性能模式和省电模式,关键时刻火力全开,平时就低功耗运行。
*
更快的大脑:DeepSeek-V3.1-Think 版本号称思考效率更高,能在更短时间内给出答案。时间就是金钱,这句话在AI领域同样适用,谁能更快解决问题,谁就更有竞争力。
*
更强的“打工人”能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。这意味着 DeepSeek 不仅仅能耍嘴皮子,还能真正上手干活,帮用户解决实际问题。
用户可以在官方 App 和网页端体验升级后的DeepSeek-V3.1,通过“深度思考”按钮,在两种模式之间自由切换。API 也同步升级,提供对应的思考和非思考模式接口,上下文长度扩展到 128K,并且支持更严格的 Function Calling 模式,确保输出结果符合预期。
此外,DeepSeek 还增加了对 Anthropic API 格式的支持,方便用户将 DeepSeek-V3.1 集成到 Claude Code 框架中。

从官方给出的测试数据来看,DeepSeek-V3.1 在代码修复(SWE)和命令行终端环境下的复杂任务(Terminal-Bench)中,相比之前的 DeepSeek 系列模型有明显提升。在复杂推理和搜索能力上,也取得了不错的成绩。

值得一提的是,DeepSeek-V3.1 通过思维链压缩训练,在保证性能的同时,有效减少了输出的 token 数量,降低了成本。
不过,光有技术进步还不够,商业化落地才是关键。DeepSeek 将于 2025 年 9 月 6 日凌晨起,调整开放平台 API 接口调用价格,执行新的定价策略,并且取消夜间时段优惠。这意味着,用了更多,就要掏更多的钱。

总的来说,DeepSeek-V3.1 的发布,在技术层面带来了不少亮点,尤其是在 Agent 能力方面,让人看到了 AI 进一步赋能各行各业的潜力。但同时,API 价格的调整,也给用户带来了一定的成本压力。未来,DeepSeek 如何在技术创新和商业化之间找到平衡,将是其能否在激烈的市场竞争中脱颖而出的关键。
