苹果最新的人工智能工具,能根据你的描述给图片添加动画

苹果公司在其不断增长的人工智能领域又有了新的成果,他们开发了一种工具,利用大型语言模型(LLMs)根据用户的文本提示来给静态图像添加动画效果。

apple AI research dall e

海外媒体 MacRumors根据DALL·E制作的图片

苹果在一篇名为“Keyframer: Empowering Animation Design Using Large Language Models”的新研究论文中描述了这一创新。

“尽管单次提示界面在类似Dall·E和Midjourney的商业文本转图像系统中很常见,但我们认为动画需要更复杂的用户考虑因素,比如时间和协调,这些因素很难在一个提示中完全指定,因此可能需要其他方法来帮助用户迭代构建和改进生成的设计,尤其是对于动画。”

“我们结合了基于语言提示设计工件的新兴设计原则和LLMs的代码生成能力,构建了一个名为Keyframer的新型基于人工智能的动画工具。使用Keyframer,用户可以通过自然语言提示从静态2D图像创建动画插图。使用GPT-4 3,Keyframer生成用于给输入的可伸缩矢量图形(SVG)添加动画效果的CSS动画代码。”

要创建动画,用户需要上传一个SVG图像,比如一个太空火箭,然后输入一个提示,比如“生成三个设计,其中天空淡入不同的颜色,星星闪烁。”然后Keyframer会生成动画的CSS代码,用户可以通过直接编辑代码或输入其他文本提示来进一步完善动画。

文中的作者解释说:“Keyframer通过顺序提示使用户能够迭代完善他们的设计,而不需要一开始就考虑整个设计。通过这项工作,我们希望激发未来结合LLMs强大生成能力的动画设计工具,以加快设计原型制作速度,并让创作者保持创造性的控制。”

根据论文,该研究是基于对专业动画设计师和工程师的访谈。论文中引用了一位研究参与者的评价:“我觉得这比我之前做过的很多事情都快。之前做这样的工作可能需要数小时。”

ai model animates images 1ai model animates images 1
这一创新只是苹果公司一系列人工智能突破中的最新成果。上周,苹果研究员发布了一款利用多模态LLMs对图像进行像素级编辑的人工智能模型。

去年12月底,苹果还公布了一项在内存有限的iPhone和其他苹果设备上部署LLMs的创新闪存利用技术。

据《Information》杂志和分析师Jeff Pu报道,苹果将在今年晚些时候发布iOS 18,在iPhone和iPad上提供某种生成式人工智能功能。据《彭博社》记者Mark Gurman报道,苹果的下一个移动软件版本将包括增强版的Siri,具备ChatGPT类似的生成式人工智能功能,有可能成为iPhone历史上“最大”的更新。

(via VentureBeat.)

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行二次审核删除:fireflyrqh@163.com。
(0)
上一篇 2024年2月14日 上午11:23
下一篇 2024年2月14日 下午7:30

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注