科技日报记者 刘霞
很多人仍认为人工智能(AI)天生的语音听起来“机械感”较着,但英国伦敦玛丽女王年夜学研究团队于新出书的《大众科学藏书楼·综合》杂志上发表论文指出,AI语音合成技能已经进入新阶段,其天生的“克隆语音”或者深度伪造声音,传神度与真人灌音无异。

研究团队采用当前开始进的AI语音合成东西,天生两类合针言音:一类是基在真人灌音的“克隆”声音,旨于模拟特定措辞者;另外一类则由年夜型语音模子天生,不针对于详细小我私家。介入者被要求鉴别声音的真实性与可托度。
只管研究未发明AI声音存于“超真实效应”(即比真人更像真人),但成果显示,“克隆语音”的传神度已经与真人声音八两半斤,使人难以分辩。且部门AI天生的声音于可托度评价中甚至逾越了真人灌音。
研究团队暗示,AI语音已经渗入一样平常糊口,如Alexa、Siri和各种客服体系。虽然当前体系音色仍具机械特性,但天然度靠近人声的AI语音技能已经然成熟。使用商用软件仅需几分钟真人灌音,便可快速、低成当地天生高质量声音克隆,且险些无需专业常识。
最新研究显示,公家对于高仿真语音认知机制的研究刻不容缓。AI语音技能的飞速成长有望给教诲、人机交互等范畴带来立异机缘——于这些范畴,定制的高质量合针言音可加强用户体验。可是,合针言音也对于伦理、版权及安全组成挑战,特别于虚伪信息、诈骗与身份冒用等方面需增强提防。
-中国·金莎分享