OpenAI 为 ChatGPT 推出更自然的高级语音模式

open ai logo
高级语音模式可以让 ChatGPT 提供实时响应,可以在对话过程中被打断,此外它还可以识别和回应幽默、讽刺等语言风格。新模型不需要像现有的 ChatGPT 语音那样将语音转换为文本再转换回语音,从而降低了交互时的延迟。

OpenAI 在 5 月份展示了高级语音模式,展示了一个名为 Sky 的 AI 语音,其声音与斯嘉丽·约翰逊的声音惊人地相似。这个声音是在没有约翰逊许可的情况下创建和使用的,她最终发表了声明。她表示,她拒绝了 OpenAI 首席执行官山姆·奥特曼的多次提议,奥特曼希望约翰逊成为 ChatGPT 的声音。她说,她对奥特曼创造了一个声音与她自己的声音“惊人地相似”感到“震惊、愤怒和难以置信”。OpenAI 声称 Sky 语音并非意图模仿约翰逊的声音,但在她雇佣了法律顾问后,该声音被移除。

OpenAI 表示,自从展示了高级语音模式以来,一直在努力提高语音对话的安全性,并致力于改进语音对话的安全和质量。高级语音模式使用四种预设声音,并且被设计为阻止与这些声音不同的输出,防止它模仿名人声音。OpenAI 还“实施了护栏”以阻止对暴力或版权内容的请求,早期测试将用于在更广泛发布之前改进该功能。

获得高级语音模式访问权限的用户将收到一封包含说明的电子邮件,OpenAI 计划逐步向更多人开放该功能。所有 Plus 用户将在秋季获得高级语音模式的访问权限。

关于高级语音模式的分析:

高级语音模式的出现,标志着 ChatGPT 在人机交互方面迈出了重要一步。通过实时响应、理解不同语言风格,并消除文本转语音的转换过程,高级语音模式可以让用户更加自然、高效地与 AI 进行交流。

然而,OpenAI 在使用斯嘉丽·约翰逊的声音引发的争议也提醒我们,AI 技术的应用需要更加谨慎,避免侵犯个人权益,同时要注重技术伦理和安全规范。

随着高级语音模式的推广,我们有理由相信,未来人机交互方式将更加多元化,人工智能将更好地融入我们的生活。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行二次审核删除:fireflyrqh@163.com。
(0)
上一篇 2024年7月31日 上午7:54
下一篇 2024年7月31日 上午9:00

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注