AiSiri网8月8日消息,OpenAI今天凌晨的直播引爆科技圈,正式发布了GPT-5模型,直接亮肌肉,号称自家最强,编程、数学、写作、健康、视觉感知,几乎没有它不碾压的领域。
OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)放出豪言,称GPT-5是该公司此前人工智能模型的“重大升级”,并表示“与它交流,真的就像在和任何领域的专家对话”。
GPT-5今日起开始向免费用户和付费用户逐步推送,但世界的参差永远存在,谁氪金谁牛X,付费用户拥有更高的使用限额,这就是规则。
Pro订阅者能无限玩GPT-5,还能解锁更高阶的GPT-5 Pro;Plus用户可以把它当成日常聊天工具,想怎么用怎么用,用量自然比白嫖党高得多。
GPT-5不是单打独斗的愣头青,而是一个团队:智能高效模型+深度推理模型(GPT-5 thinking)+实时路由器,AI界都开始讲究团队协作了。
智能高效模型负责处理日常问题;深度推理模型专攻疑难杂症。
实时路由器就像个调度员,根据对话类型、复杂性、工具需求、用户意图,迅速选派合适的模型,而且还会根据真实数据持续学习进化,避免人工智障。
万一用量超标,每个模型的精简版会顶上,处理剩余的查询。OpenAI还声称,将来会把所有这些功能整合到一个模型里,期待一手“大力出奇迹”。
GPT-5在各种测试中都吊打前辈,回答速度更快,更靠谱,减少胡说八道,更好地理解用户意图,总之就是更听话了。
尤其在写作、编程、健康咨询这三个最常用的场景,提升巨大。
编程:目前最强的编程模型,前端开发、代码调试能力大幅提升,可以根据简单的提示词,创造出漂亮又好用的网站、App、游戏等,以后程序员是不是要失业了?
创意表达与写作:能把模糊的想法变成引人入胜的文学作品,对结构不清晰的写作任务处理得更好,日常写作效率up up!
健康:在健康问题上表现出色,HealthBench上的得分遥遥领先,能更主动地发现潜在问题,提出更有针对性的问题,根据用户的背景、知识水平、地理位置,给出更准确的回答,但再牛也别当真,生病了还得找医生!
GPT-5还在数学(AIME 2025无工具时94.6%)、真实世界编程(SWE-bench Verified 74.9%、Aider Polyglot 88%)、多模态理解(MMMU 84.2%)、健康(HealthBench Hard 46.2%)等方面刷新了纪录。
GPT-5 Pro更牛,在GPQA上再创新高,无工具时得分88.4%。
GPT-5 Pro专啃硬骨头,替代OpenAI o3-Pro,思考时间更长,烧更多钱,目标只有一个:提供最高质量的答案。
在智力测试中表现优异,在超过1000个真实世界推理提示的评估中,专家更青睐GPT-5 Pro,它的主要错误减少22%,在健康、科学、数学、编程等方面表现出色。AI内卷,专家饭碗岌岌可危?