1月22日行业消息,通义千问旗下的Qwen3-TTS语音生成模型正式对外开放。这个系列不仅能“复制”已有音色,还能凭空创造新声音,给音频内容增添更多拟人口吻,甚至支持用日常语言指令来调节发音细节。
目前开源的模型包含1.7B和0.6B两个大小版本,已覆盖中文、英文、日语、韩语、德语、法语等全球10种主流语言,并且加入了多地方言特色音色选项。(信源:广角观察)#大厂科技动态#
1月22日行业消息,通义千问旗下的Qwen3-TTS语音生成模型正式对外开放。这个系列不仅能“复制”已有音色,还能凭空创造新声音,给音频内容增添更多拟人口吻,甚至支持用日常语言指令来调节发音细节。
目前开源的模型包含1.7B和0.6B两个大小版本,已覆盖中文、英文、日语、韩语、德语、法语等全球10种主流语言,并且加入了多地方言特色音色选项。(信源:广角观察)#大厂科技动态#
Previous: 【OpenAI已建立人形机器人实验室,启动以来规模扩大四倍多】
Next: 【AI应用概念快速走高,浙文互联4天2板】