【2024-05-30 18:58:27爱思瑞网快讯】
苹果的下一代操作系统将推出“灰质项目”,带来多项与人工智能相关的增强功能。我们得到了Siri、Notes和Messages的人工智能功能的新细节。
消息灵通的人士透露,在苹果的年度WWDC之前,该公司内部正在测试各种新的与人工智能相关的功能。该公司的AI改进将着重于给最终用户带来实际的好处。
在苹果的操作系统的预发布版本中,该公司一直在开发一种名为“灰质迎头赶上”的通知摘要功能。这个功能与Siri相关联,这意味着用户将能够通过虚拟助手请求和接收他们最近通知的概述。
预计Siri将通过一种新的智能响应框架和苹果的设备上的LLM获得显著的响应生成能力更新。在生成回复和摘要时,Siri将能够考虑人物和公司、日历事件、位置、日期等实体信息。
这意味着Siri将能够在设备上回答查询、创建长文章的摘要,或在更新的Notes或Voice Memos应用中转录音频。所有这些都将通过使用Ajax LLM或云处理来完成更复杂的任务。
我们还被告知,苹果一直在测试增强和“更自然”的语音,以及文本转语音的改进,这将最终带来显著更好的用户体验。
苹果还一直在研究Siri的跨设备媒体和电视控制功能。这个功能将允许用户例如使用他们的Apple Watch上的Siri来在另一个设备上播放音乐,尽管该功能预计要到2024年后期才能实现。
公司决定将人工智能嵌入到其核心系统应用程序中,以实现不同的用例和任务。其中一个值得注意的改进领域与照片编辑有关。
苹果开发了用于改进图像编辑的生成AI软件
iOS 18和macOS 15预计将为Photos等应用程序带来支持人工智能的图像编辑选项。在内部,苹果已经开发了一种新的“清理”功能,允许用户通过使用生成AI软件从图像中移除物体。
在苹果的测试环境中,可以通过人工智能生成图像,然后通过iMessage发送出去。有迹象表明,公司计划将类似功能引入其操作系统的最终用户。
这一信息与另一份报告一致,该报告称用户将能够使用人工智能生成独特的表情符号,尽管还有其他关于图像生成功能的可能性。
据知情人士透露,在苹果的Notes应用程序的预发布版本中,还包含有关一个生成工具的引用,不过目前尚不清楚该工具是生成文本还是图像(正如生成游乐场应用程序的情况一样)。
Notes将获得AI支持的转录和摘要功能,以及Math Notes
苹果为其内置的Notes应用程序准备了重大改进,将首次亮相iOS 18和macOS 15。更新后的Notes将获得应用内音频录制、音频转录和LLM支持的摘要功能。
音频录制、转录和基于文本的摘要将全部在一个笔记中提供,以及用户选择添加的任何其他内容。这意味着一张单独的笔记可以包含一次整个讲座或会议的录音,完整的白板图片和文本。
这些功能将使Notes成为一个真正的强大工具,使其成为学生和商务专业人士的首选应用程序。添加音频转录和摘要功能还将使苹果的Notes应用程序能够更好地竞争微软的OneNote或Otter等竞争产品。
虽然应用级别的音频录制、基于AI的音频转录和摘要功能将极大改进Notes应用程序,但这些并不是苹果一直在努力改进的唯一方面。
Math Notes – 通过使用AI创建图表和解方程
Notes应用将全新推出Math Notes,这将带来对正确数学符号的支持,并实现与苹果的新GreyParrot计算器应用的集成。我们现在对Math Notes的具体内容有了更多了解。
知情人士透露,Math Notes将允许该应用程序识别数学方程的文本并为其提供解决方案。目前还在开发支持绘制表达式的功能,这意味着我们可能会在Notes中看到类似于macOS上的Grapher应用程序的功能。
这意味着在Notes中,用户将获得一个选项,以类似于苹果当前在iOS上提供的预测文本或行内完成的方式自动完成他们的数学方程——这也预计将在今年晚些时候传至visionOS。
Apple的visionOS还将与苹果的Transformer LM实现更好的集成,后者是一种提供您输入时建议的预测文本模型。该操作系统还预计将获得重新设计的Voice Commands UI,这表明苹果非常重视与输入相关的改进。
该公司还试图通过使用所谓的“智能回复”来改善用户输入,这将在Messages、Mail和Siri中提供。这将允许用户使用苹果设备上的Ajax LLM即时生成基本的文本回复来回复消息或电子邮件。
苹果的AI与Google Gemini和其他第三方产品的竞争
人工智能已经进入几乎每个应用程序和设备。开放AI的ChatGPT和Google的Gemini等以人工智能为重点的产品在总体上的受欢迎程度也大大增加。
在5月14日的年度Google I/O开发者大会上,谷歌展示了人工智能的一个有趣用例——用户可以以视频形式提出问题,并获得人工智能生成的回答或建议。
作为活动的一部分,谷歌的人工智能观看了一段坏的唱机视频,并被询问为什么它不工作。该软件识别出了唱机的型号,并建议唱机可能没有正确平衡,因此导致不工作。
该公司还宣布了Google Veo——一种可以通过人工智能生成视频的软件。OpenAI也拥有自己的视频生成模型Sora。
苹果的Project Greymatter和Ajax LLM无法生成或处理视频,这意味着该公司的软件无法回答关于消费类产品的复杂视频问题。这很可能是苹果寻求与谷歌和OpenAI等公司合作达成许可协议并为其用户群体提供更多功能的原因。
相对于Humane AI Pin或Rabbit R1等实体AI产品,苹果的AI项目具有重要优势,因为它们在用户已经拥有的设备上运行。这意味着用户不需要购买特殊的AI设备即可享受人工智能的好处。
Humane的AI Pin和Rabbit R1也被普遍认为是未完成或部分功能的产品,后者甚至被证实不过是一个定制的Android应用程序。
预计苹果的AI相关项目将于6月10日的年度WWDC上首次亮相,作为iOS 18和macOS 15的一部分。日历、自由表单和系统设置应用程序的更新也在进行中。