首页 >> 动态 > 每日快讯 >

2024年04月01日OpenAI语音模型“炸场” 15秒样本即可复刻人声

2024-04-01 09:31:23 来源: 用户: 

继文生视频大模型Sora后,近日,OpenAI终于将按捺许久的语音引擎模型—VoiceEngine公之于众。利用文本输入和单个15秒音频样本,VoiceEngine就能生成与原说话者非常相似且情感丰富的自然语音。不过,和文本生成视频模型Sora一样,目前OpenAI只针对少部分内测用户开放VoiceEngine。华泰证券分析师认为,随着基础模型能力优化,多模态应用有望在内容创作、AI教育、虚拟陪伴等场景加速落地。VoiceEngine的问世,解锁了语音模型的更多可能性,例如辅助阅读、视频转译等,也将在发音障碍人群的语言表达上提供有效帮助。

华泰证券 +1.07%

文章转载自:互联网,非本站原创

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章