中国·金莎-最先进AI工具生成声音与人声无异

2025-10-06 13:03:44

科技日报记者刘霞

很多人仍认为人工智能（AI）天生的语音听起来“机械感”较着，但英国伦敦玛丽女王年夜学研究团队于新出书的《大众科学藏书楼·综合》杂志上发表论文指出，AI语音合成技能已经进入新阶段，其天生的“克隆语音”或者深度伪造声音，传神度与真人灌音无异。

研究团队采用当前开始进的AI语音合成东西，天生两类合针言音：一类是基在真人灌音的“克隆”声音，旨于模拟特定措辞者；另外一类则由年夜型语音模子天生，不针对于详细小我私家。介入者被要求鉴别声音的真实性与可托度。

只管研究未发明AI声音存于“超真实效应”（即比真人更像真人），但成果显示，“克隆语音”的传神度已经与真人声音八两半斤，使人难以分辩。且部门AI天生的声音于可托度评价中甚至逾越了真人灌音。

研究团队暗示，AI语音已经渗入一样平常糊口，如Alexa、Siri和各种客服体系。虽然当前体系音色仍具机械特性，但天然度靠近人声的AI语音技能已经然成熟。使用商用软件仅需几分钟真人灌音，便可快速、低成当地天生高质量声音克隆，且险些无需专业常识。

最新研究显示，公家对于高仿真语音认知机制的研究刻不容缓。AI语音技能的飞速成长有望给教诲、人机交互等范畴带来立异机缘——于这些范畴，定制的高质量合针言音可加强用户体验。可是，合针言音也对于伦理、版权及安全组成挑战，特别于虚伪信息、诈骗与身份冒用等方面需增强提防。

-中国·金莎