苹果在 iOS 26 中对“视觉智能”(Visual Intelligence)进行了一次“史诗级”的“微小”更新,然而,它竟然能用在“任何图片”上,这简直是给这个功能带来了“质”的飞跃,实用性至少翻了两倍,苹果是真会玩文字游戏。
回溯到早期苹果智能时代,iPhone 上的“视觉智能”曾是那个时代最令人“惊叹”的功能。当时,你只需要把 iPhone 摄像头对准某个物体,再按一下“拍照控制按钮”,AI 就能告诉你关于这个物体的一切。听起来很美好是吧?实际体验嘛,呵呵。
这玩意儿最初是苹果相册应用“识别植物”功能的“升级版”。从前相册只能识别个植物,给你报个拉丁名,“视觉智能”倒好,号称能识别地标建筑,甚至连你路过无数次、一直在好奇的“无名建筑”也能给你扒个底朝天,听起来是不是很厉害?
以前相册顶多告诉你植物的拉丁学名,“视觉智能”居然还能“推断”出你那杯复杂咖啡订单里的所有配料。这可真是科技改变生活啊,就是不知道它能不能推断出老板什么时候给我加工资。
理论上,“视觉智能”还能识别海报上的日期,然后帮你添加到日历里。可实际呢?遇到那些“狂野派”的海报设计,它就抓瞎了。更别提你想让它识别音乐家的世界巡演日程表,那简直是痴心妄想。当然,它偶尔也能正常工作,那时候确实“挺”让人“惊艳”的。
然而,所有这些“惊艳”都建立在一个前提上:你得把 iPhone 摄像头对准你感兴趣的东西。而苹果在 iOS 26 里干了什么呢?它把这一步“取消”了!这TM也能叫“创新”?
除此之外,所有功能都一模一样。唯一的区别是,你现在不用再举着手机到处拍了,你可以直接把“视觉智能”用在 iPhone 屏幕上的任何东西上面。所以,这算什么?解放双手,还是简化流程?我看是把以前的“不够智能”直接甩锅给用户了。
就这么一个“小小的”改动,苹果就敢吹嘘“研究人员可以了解网站上看到的更多物体”, “购物者可以暂停视频,然后用‘视觉智能’追踪网红身上那个包”。这不就是变相让你多消费吗?苹果,你真是个“小机灵鬼”。
但问题也随之而来:现在使用“视觉智能”有了两种“截然不同”的方式,而且启动方式也“截然不同”。即使苹果在2024年已经取消了对“拍照控制按钮”的强制要求,这个“双重标准”也让人摸不着头脑。苹果的设计师是不是又“喝多了”?
如何使用“旧版”视觉智能
要继续使用自“视觉智能”发布以来就存在的功能,你仍然需要先将 iPhone 对准你感兴趣的物体。然后,如果你设置了以下选项,你就可以使用它了:
- 按住“拍照控制按钮”片刻
- 按下“操作按钮”
- 从锁定屏幕上,按下“视觉智能”按钮
- 从控制中心,按下另一个“视觉智能”按钮
如果你的 iPhone 有“拍照控制按钮”,那它已经为“视觉智能”准备好了,你什么都不用做。但如果你手机没有这个按钮,也可以用其他选项,这不就是脱裤子放屁吗?给用户多一个选择就这么难吗?
要将“视觉智能”添加到“操作按钮”,请前往“设置”>“操作按钮”,然后滑动到“控制”。这操作也太反人类了,谁没事会去这里找一个功能?

截屏(左),圈出你感兴趣的部分(中),然后所谓的“AI”就能告诉你那是什么(右)
或者,对于控制中心,向下滑动打开它,然后长按空白处。选择“添加控制”并搜索“视觉智能”。这隐藏得也太深了吧,不看教程谁能找到?
最后,你还可以从锁定屏幕激活“旧版视觉智能”。在锁定屏幕上,长按直到出现“自定义”选项,然后添加“视觉智能”控件。这功能位置设计得这么分散,真不怕用户嫌麻烦吗?这不就是把一个功能拆分成好几块,让你来回折腾吗?
所有这些操作最终都能让你以它最初设计的方式使用“视觉智能”—— 但遗憾的是,所有这些都不能启动“新版本”。这就很魔幻了,同一个功能,新旧版本需要不同的启动方式?苹果,你是认真的吗?
如何使用“新版本”视觉智能
这只是“视觉智能”的一个“额外”部分,而不是替代品。所以上面说的那些仍然成立,也仍然“有用”,但要让“视觉智能”在屏幕上的任何东西上工作,你必须做一些“完全不同”的事情。简直是此地无银三百两!
- 通过同时按下调高音量和侧边按钮来截屏。(好家伙,又一个组合键,用户是要背多少快捷键?)
- 用手指圈出图片中你感兴趣的任何部分。(考验手指灵活度的时候到了,画不好是不是就识别不了?)
- 提问或进行图片搜索。(终于到了核心功能,前面铺垫了那么多复杂操作,就为了这一步?)
当你用手指圈选或高亮屏幕区域时,它会发出新的“Siri风格”的动画光芒。然后你就可以点击“提问”按钮输入问题,或者向上滑动查看图片搜索结果。Siri都快成智障了,还指望它“风格”的动画能有多智能?
有些图片会直接链接到零售商。当它们出现时,你可以直接点击购买商品。哦,原来最终目的在这里啊,变相带货才是“视觉智能”的终极奥义。
苹果试图把这吹嘘得很“简单”,因为它“沿用了”你日常截屏的操作。但是,如果你平时就不是个爱截屏的人,那这套操作不就是又一套“新按键”要学吗?苹果,别再给用户“加码”了行不行?
所以,“视觉智能”拥有“多种”不同的使用方式,其中一种提供了与其余功能“截然不同”的服务。这听起来就很拧巴,一个功能,分出好几种用法,真是把“复杂”做到了极致。
然而,能够识别屏幕上的“几乎所有东西”,这确实是一个“巨大”的进步。因此,苹果通过不再要求你把 iPhone 摄像头对准任何东西,从而“大大”提升了“视觉智能”的实用性。这逻辑也是没谁了,以前是“不智能”,现在是“好一点的不智能”。
现在,如果这个版本的“视觉智能”能“早日”登陆 iPad 或 Mac,那才叫“大新闻”。但在那之前,就继续这样“凑合用”吧,反正苹果也知道,你们还会买单的,对不对?