【2025-02-01 03:16:00AI Siri网最新消息】
视觉智能可能是苹果智能功能中最强大的之一。它是什么,如何运作,我们将通过几个现实世界的例子来展示。
苹果在 iOS 18.2 中添加了视觉智能,您需要 iPhone 16 或 iPhone 16 Pro 才能使用它。很遗憾,iPhone 15 Pro 用户无法使用此功能。
视觉智能属于苹果智能功能的范畴。它是少数专门针对 iPhone 16 系列的功能之一。
这个 AI 功能利用您 iPhone 的摄像头扫描环境并提供信息。如果这听起来有些抽象,别担心,我们将展示多个演示,以说明它如何能帮到您。
如何使用视觉智能
要激活视觉智能,您需要按住 iPhone 右下角的摄像头控制按钮。这与短按打开相机应用程序不同。
您的手机会在打开摄像头时震动,并带有流畅多彩的动画。您会看到一个新的界面,显示摄像头的实时画面,中间有“询问”按钮、“搜索”按钮和“捕捉”按钮。
让我们开始最基本的用法。打开视觉智能,指向某物,然后拍照。
视觉智能可以帮助识别电缆
然后,您可以通过 ChatGPT 获取关于您所观察内容的信息,或者进行 Google 图片搜索以了解更多信息。
例如,我们可以拍摄工作室中的各种电缆。每次,视觉智能都能够识别它们,并提供一些基本信息。
如果您碰到不太了解的电缆,还可以提出后续问题以获取更多信息,比如关于 DisplayPort 电缆的详细解析。
我们还有一款旧款 GameBoy Color,快速扫描一下,就可以询问它的发行年份。
这些信息都可以通过 ChatGPT 获得,您还可以使用图像搜索功能。
在文本使用视觉智能
除了询问问题或搜索照片,它还能帮助处理文本和数字。
当您将其对准一段文本时,会出现新的上下文按钮。您可以生成 AI 摘要,或让手机大声朗读。
如果您正在旅行,设备识别到其他语言的文本,还会出现翻译按钮。点击它后,会拍摄照片并将图像上的文本替换为默认语言。
例如,我们测试了将西班牙语的餐厅菜单翻译成英语,这非常方便,因为无需使用任何其他应用程序,系统会自动完成。
关于文本和数字,还有解决方程的功能。这在学校时会非常有用。
视觉智能能够逐步求解数学问题,您无需输入,仅需扫描并要求其解决。它甚至会为我们逐步展示示例方程的解法。
扫描食物项目
虽然它的准确性有限,视觉智能也能帮助我们获取食物的宏量营养成分。与其他演示一样,我们只需将其指向盘子,就能识别食物并提供大致的营养范围。
虽然只是粗略估算,但视觉智能给出了我们吃的爆米花的营养信息。当我们询问它一把爆米花的卡路里时,它告诉我们,这样一把的卡路里取决于种类和制作方式。
如果结合这一范围和您对这款爆米花(如 SmartPop、空气炸制、电影院风格等)的了解,便能清楚实际的卡路里值。
碳水化合物的计算在更精准的情况下会有重要意义。
同样,我们拍摄了一款糖霜甜甜圈,并询问其碳水化合物含量。它再次给出了可能的碳水化合物范围。
这样的功能对于某些用户至关重要,比如刚被诊断为 1 型糖尿病的儿童,可能还不擅长碳水化合物的计算。
希望随着 AI 模型的改进,准确度能逐渐提高。
识别植物和动物
在 iOS 18.3 中,苹果为视觉智能新增了一些功能。现在,视觉智能可以自动识别植物和动物。
当我们将其对准厨房的植物时,顶部会出现一个气泡,显示植物的名称。一旦点击气泡,便会显示来自维基百科的额外信息。
同样,它也适用于动物,不过如果是狗的话,需有一定的纯种特征。没有 AI 能仅凭照片准确判断狗的血统。
我们的狗布鲁克林被标识为平毛寻回犬。尽管她可能身上有一些寻回犬的基因,但绝非纯种。
其他更通用的动物识别可能会更合理,或至少能做到初步识别。
预约安排功能
在 iOS 18.3 中,还加入了预约安排的功能。它可以识别各种场景的信息,包括标志牌、海报和手写便签。
在纽约时,我们可以扫描剧院的正面,将演出的开幕日期添加到日历中。在家时,我们也可以扫描粘贴在冰箱上的约会便条。
在日历中快速添加约会。您可以在保存之前编辑日历预约。最棒的是,在日历应用中查看时,源照片也会附上以供参考。
识别餐馆和商家
我们最喜欢的视觉智能功能是与建筑、商家和餐馆的结合应用。根据商家的不同,有丰富的功能。
在纽约旅行时,视觉智能帮助我们查看地标,轻松识别其名称、建造年份等实用信息。
如果您看到一家商店,可以指向它以获取所有相关商业信息。系统会显示营业时间、网站、电话号码等。
扫描餐馆时,可以显示食物照片、菜单,并进行下单,前提是餐馆支持预约、在线订餐等。
我们在小镇测试时发现,可以获取当地咖啡馆的营业时间,而披萨店则可让我们查看菜单并下单外带。
视觉智能在不断进步
整体来看,苹果的智能功能推出速度较慢,但苹果显然对此抱有信心。像我们在这里看到的视觉智能,越来越多的功能不断添加。
尽管新的按钮和操作方式需要一些适应,但一旦开始使用,就会发现它非常实用。随着苹果不断优化智能功能,我们很可能会看到更多的使用案例。