苹果公司在其不断增长的人工智能领域又有了新的成果,他们开发了一种工具,利用大型语言模型(LLMs)根据用户的文本提示来给静态图像添加动画效果。
苹果在一篇名为“Keyframer: Empowering Animation Design Using Large Language Models”的新研究论文中描述了这一创新。
“尽管单次提示界面在类似Dall·E和Midjourney的商业文本转图像系统中很常见,但我们认为动画需要更复杂的用户考虑因素,比如时间和协调,这些因素很难在一个提示中完全指定,因此可能需要其他方法来帮助用户迭代构建和改进生成的设计,尤其是对于动画。”
“我们结合了基于语言提示设计工件的新兴设计原则和LLMs的代码生成能力,构建了一个名为Keyframer的新型基于人工智能的动画工具。使用Keyframer,用户可以通过自然语言提示从静态2D图像创建动画插图。使用GPT-4 3,Keyframer生成用于给输入的可伸缩矢量图形(SVG)添加动画效果的CSS动画代码。”
要创建动画,用户需要上传一个SVG图像,比如一个太空火箭,然后输入一个提示,比如“生成三个设计,其中天空淡入不同的颜色,星星闪烁。”然后Keyframer会生成动画的CSS代码,用户可以通过直接编辑代码或输入其他文本提示来进一步完善动画。
文中的作者解释说:“Keyframer通过顺序提示使用户能够迭代完善他们的设计,而不需要一开始就考虑整个设计。通过这项工作,我们希望激发未来结合LLMs强大生成能力的动画设计工具,以加快设计原型制作速度,并让创作者保持创造性的控制。”
根据论文,该研究是基于对专业动画设计师和工程师的访谈。论文中引用了一位研究参与者的评价:“我觉得这比我之前做过的很多事情都快。之前做这样的工作可能需要数小时。”
这一创新只是苹果公司一系列人工智能突破中的最新成果。上周,苹果研究员发布了一款利用多模态LLMs对图像进行像素级编辑的人工智能模型。
去年12月底,苹果还公布了一项在内存有限的iPhone和其他苹果设备上部署LLMs的创新闪存利用技术。
据《Information》杂志和分析师Jeff Pu报道,苹果将在今年晚些时候发布iOS 18,在iPhone和iPad上提供某种生成式人工智能功能。据《彭博社》记者Mark Gurman报道,苹果的下一个移动软件版本将包括增强版的Siri,具备ChatGPT类似的生成式人工智能功能,有可能成为iPhone历史上“最大”的更新。
(via VentureBeat.)