首页 > 动态 > 每日快讯 > > 正文
2024-04-01 09:31:23

2024年04月01日OpenAI语音模型“炸场” 15秒样本即可复刻人声

导读 继文生视频大模型Sora后,近日,OpenAI终于将按捺许久的语音引擎模型—VoiceEngine公之于众。利用文本输入和单个15秒音频样本,VoiceEngine

继文生视频大模型Sora后,近日,OpenAI终于将按捺许久的语音引擎模型—VoiceEngine公之于众。利用文本输入和单个15秒音频样本,VoiceEngine就能生成与原说话者非常相似且情感丰富的自然语音。不过,和文本生成视频模型Sora一样,目前OpenAI只针对少部分内测用户开放VoiceEngine。华泰证券分析师认为,随着基础模型能力优化,多模态应用有望在内容创作、AI教育、虚拟陪伴等场景加速落地。VoiceEngine的问世,解锁了语音模型的更多可能性,例如辅助阅读、视频转译等,也将在发音障碍人群的语言表达上提供有效帮助。

华泰证券 +1.07%

文章转载自:互联网,非本站原创