点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:最先进AI工具生成声音与人声无异
首页> 数字化频道> AI+ > 正文

最先进AI工具生成声音与人声无异

来源:中国科技网2025-09-30 14:54

  许多人仍认为人工智能(AI)生成的语音听起来“机械感”明显,但英国伦敦玛丽女王大学研究团队在新出版的《公共科学图书馆·综合》杂志上发表论文指出,AI语音合成技术已进入新阶段,其生成的“克隆语音”或深度伪造声音,逼真度与真人录音无异。

  研究团队采用当前最先进的AI语音合成工具,生成两类合成语音:一类是基于真人录音的“克隆”声音,旨在模仿特定说话者;另一类则由大型语音模型生成,不针对具体个人。参与者被要求辨别声音的真实性与可信度。

  尽管研究未发现AI声音存在“超真实效应”(即比真人更像真人),但结果显示,“克隆语音”的逼真度已与真人声音不相上下,令人难以分辨。且部分AI生成的声音在可信度评价中甚至超越了真人录音。

  研究团队表示,AI语音已渗透日常生活,如Alexa、Siri及各类客服系统。虽然当前系统音色仍具机械特征,但自然度接近人声的AI语音技术已然成熟。利用商用软件仅需几分钟真人录音,即可快速、低成本地生成高质量声音克隆,且几乎无需专业知识。

  最新研究显示,公众对高仿真语音认知机制的研究迫在眉睫。AI语音技术的飞速发展有望给教育、人机交互等领域带来创新机遇——在这些领域,定制的高质量合成语音可增强用户体验。但是,合成语音也对伦理、版权和安全构成挑战,尤其在虚假信息、诈骗与身份冒用等方面需加强防范。(科技日报记者 刘霞)

 

[ 责编:张晨昊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2025年中国国际海事会展在沪开幕

  • 山东部分地区迎降雪

独家策划

推荐阅读
民族文化宫里珍宝千千万,但说到“镇馆之宝”,首先想到的便是1300多年前文成公主带到西藏的长鼓,许多观众慕名而来只为一睹它的“芳容”。
2025-11-28 13:02
为庆祝新疆维吾尔自治区成立70周年,“异元汽车杯”首届新疆国际摄影大赛9月28日正式启动。
2025-09-29 14:31
2025年4月10日,安徽省芜湖市无为市昆山镇三公山茶叶种植基地,千亩高山野生杜鹃在翠绿的茶园之间绚丽绽放,美轮美奂,美不胜收
2025-04-10 15:13
2025年4月1日,北京怀柔慕田峪长城内外山花盛开,美丽的春花把古长城打扮的多姿多娇,犹如春天里一幅壮美的风景画
2025-04-02 15:44