微软推出语音合成模型NaturalSpeech2:语音重构“更准确”,不
发布时间:2023-07-29 11:53 文章来源:IT之家 阅读量:19347
,微软日前推出了一款名为 NaturalSpeech2 的语音模型,该模型采用“潜在扩散”式设计,在零样本语音合成层面效果出众,微软宣称该模型提供了“商业级”的语音 / 歌唱解决方案,能够给予用户高质量、多样化的语音合成体验。
微软对 NaturalSpeech2 进行了一系列演示,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格的语音的能力。
据悉,与传统的语音转文字系统不同,微软的 NaturalSpeech2 使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段,不会产生“缺乏感情”的“棒读(一字一顿地讲话)”现象。
实验结果表明,NaturalSpeech2 在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在 LibriTTS 和 VCTK 测试集上的自然度与真人语音难以区分。
该项目的论文目前已经发布于 GitHub 中,感兴趣的IT之家小伙伴们可以点此访问。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
推荐阅读
-
中国信通院发布《2023年二季度互联网投融资运行情况》研究报告,...
,据中国信通院CAICT官方公众号报道,日前,中国信息通信研究院政策与经济研... -
恒大汽车达成复牌指引恢复买卖...
,昨晚恒大汽车发布公告称,恒大汽车股份自2022年4月1日上午9时正起暂停买... -
壹号本OneXPlayer2Pro掌机普通版开始上市:R7784...
,壹号本在今年7月份推出了OneXPlayer2ProEVA联名限量版三合一... -
AYANEO复古安卓掌机PocketAIR明日开启预定:天玑12...
,据AYANEO官方消息,复古安卓掌机PocketAIR将在明日下午3点开启... -
北交所:引导公募基金扩大投资规模...
近日,北京证券交易所与易方达基金、招商基金、广发基金、南方基金、华夏基金、嘉... -
北交大开源国内首个交通大模型TransGPT,可免费商用...
,北京交通大学联合中国计算机学会智慧交通分会和足智多模公司等机构,日前正式发... -
66万元的牛到底有多“牛”?...
央广网锡林郭勒7月27日消息(记者魏全民见习记者李春雪)“66万20号第三次... -
去年交强险保费收入2465亿承保亏损22亿车均保费763元...
7月28日,国家金融监督管理总局披露显示,2022年,交强险呈现覆盖面持续扩... -
南京挂牌12宗涉宅地块,总起始价170.8亿元...
具体而言,此次推出的12宗地块中,挂牌起始价最高的地块为NO.2023G43... -
信也科技印尼业务宣布与印尼数字银行Seabank达成合作...
7月27日,总部位于上海的金融科技公司信也科技宣布,旗下印尼业务品牌AdaK... -
MINICooperEV纯电车型内饰细节公开:圆形中控屏,提供多...
,继前些天公布了座舱布局之后,MINI汽车今日公布了旗下全新纯电车型Coop... -
扎克伯格:Threads或成Meta的下一个拥有10亿用户的社交...
据国外媒体报道,扎克伯格在投资者会议上表示他相信Threads有潜力成为Me...