点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:“语音引擎”可从15秒样本复制原声
首页> 数字化频道> AI+ > 正文

“语音引擎”可从15秒样本复制原声

来源:科技日报2024-04-02 19:54

  科技日报北京4月1日电 (记者张梦然)据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。

  OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。

  用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。

  “语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。

  “语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。

  OpenAI目前并未立即向市场全面推广,而是选择与少数早期测试者谨慎地合作,共同探索“语音引擎”的应用可能和潜在风险。

  “语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。OpenAI指出,“语音引擎”可能导致语音身份验证措施出现问题,以及让大众在误以为自己与熟人通话的情况下涉入骗局。

  OpenAI表示希望进行更多研究,以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。

[ 责编:孔繁鑫 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 昌九高铁全线铺轨贯通

  • “中国航天深空探月”VR展在蒙古国开展

独家策划

推荐阅读
金黄的沃野铺展千里,浩吉铁路的列车如银龙穿梭穿行于连片的金色麦田间,与错落有致的村庄、湛蓝的晴空相映成趣,勾勒出一幅生机盎然的夏收画卷
2026-05-30 19:26
随着3号塔中跨14号斜拉索成功完成安装,标志着世界最大跨度公铁两用无砟轨道斜拉桥——崇启公铁长江大桥斜拉索全部安装完成。
2026-05-30 19:25
新疆昌吉回族自治州昌吉市南部山区江布拉提草原绿意盎然,连绵雪峰与青青草甸相映成趣,羊群散落山间
2026-05-30 19:25
“六一”儿童节前夕,全国多地依托“文化+科技”模式开展特色活动。孩子们走进博物馆近距离观赏文物,在科技馆沉浸式体验科普,在动手探索与实地探访中解锁新知,怀揣满满的好奇心与求知欲,迎接属于自己的节日到来。
2026-05-30 19:24
山东省日照市晴空万里,碧海与蓝天交相辉映,海面之上游艇、帆船逐浪而行,为这座滨海小城绘就出灵动秀美的初夏画卷
2026-05-30 19:22