- 科睿唯安更新WOS期刊目录!多本 82
- 国际经济与贸易方向优秀论文题目有 45
- 北京大学第三医院李子健团队发现调 111
- 苏州大学附属第一医院在线粒体调控 60
- 《2023年中国科学院文献情报中 211
- 科学论文的他引次数是指什么? 25
- 什么是定性管理 59
- 发表比较文学与世界文学相关论文的 49
- 童话著作是否公开出版? 55
- 哪些是需要出书的人群? 55
- 会议论文属于EI吗? 75
- 福州大学谭理课题组与复旦大学刘智 41
- 研究生论文中包含致谢要被检测吗? 39
- 医学sci小类学科大全推荐 51
- 论文查重多了会被收录吗知乎 30
- San Jose State U 1400
- 中国环境科学学会 7429
- WILL 23404
- 中联云海 1380
- 汕头大学 7385
- 西安美丽医药公司 17377
- 中国科学院自动化所 23385
- 武汉青博盛学术服务有限公司 23380
- 中国医疗保健国际交流促进会氢分子 1424
- 北京企升会展有限公司 23393
- 万怡会展 22378
- 郑州迎春会议策划有限公司 1394
- 上海乾振 7429
- 中国岩石力学与工程学会 20423
- 武汉中会会议服务有限公司 22396
- 长沙金蚕信息科技有限公司 7397
- 青岛皇冠商务会展有限公司 22407
- 大连理工大学土木水利学院结构工程 17456
- International As 7394
- 北京宝利通信息咨询有限公司 22366
清华大学 深圳国际研究生院吴志勇团队关于篇章语音合成领域的论文入选ICASSP 2023 Top 3%论文
2024/04/09
语音合成技术旨在根据给定的文本合成可理解的自然语音,这对于构建和谐、可靠的智能语音交互环境至关重要。智能语音交互的广泛应用对语音合成提出了新的挑战,用户希望听到的语音更具有感染力和舒适度,尤其是在有声读物、新闻播报、虚拟人等需要长篇语音的场景中。然而,现有工作局限在单一语句的语音合成中,不仅合成语音缺乏符合上下文语境的表现力,还会造成相邻语句之间说话风格出现突兀的变化。
近日,清华大学深圳国际研究生院吴志勇团队在基于风格建模的篇章语音合成领域取得新进展。研究团队提出了一种结合多模态、多语句上下文信息为篇章语音合成建模符合上下文语义且具有连贯性的说话风格的新方法。该方法同时考虑了文本侧的上下文语境信息和语音侧的历史风格信息,利用基于层级变换器(Hierarchical Transformer)的预测器,在词级别和句子级别两个层级分别建模不同模态信息之间的关系。与此同时,为了更好地学习到语音中的风格表征,团队引入了以无监督的方式预训练的风格提取器对风格预测器的训练提供指导。在此基础上,团队提出的方案可以逐句生成具有连贯说话风格和表现力的篇章语音。
图1 模型的整体结构
图2 上下文感知的风格预测器结构
与现有工作相比,团队提出的方法使得不论是合成单一语句还是合成篇章语音都可以提升合成语音的表现力和自然度。尤其是在篇章语音合成中,考虑到段落内各个句子说话风格之间的关系,团队提出的模型在主观意见得分上取得了进一步的提升。团队提出的模型在不需要引入人工标注的情况下无监督地学习语音的风格信息,将模型感知范围从单一语句、文本模态提升到了多个语句、多个模态,并在单一语句和篇章语音的合成上都优于现有语音合成方法,是迈向篇章语音合成的一大突破。
图3 在单一语句合成和篇章合成实验
相关研究成果近日以“面向有声读物合成的上下文感知连贯性说话风格预测方法”(Context-aware Coherent Speaking Style Prediction With Hierarchical Transformers for Audiobook Speech Synthesis)为题,被“IEEE声学、语音与信号处理国际会议”(2023 IEEE International Conference on Acoustics, Speech, and Signal Processing)录用为口头报告(Oral),并入选TOP 3%论文。
图4 Top 3%论文认证证书
清华大学深圳国际研究生院2021级硕士生雷舜和2020级硕士生周逸轩为该文章的共同第一作者,通讯作者为清华大学深圳国际研究生院吴志勇副研究员,论文共同作者还包括清华大学深圳国际研究生院2021级博士生陈礼扬,元象唯思控股(深圳)有限公司康世胤博士和香港中文大学系统工程与工程管理学系蒙美玲教授。该研究成果得到了国家自然科学基金委员会、深圳市科技创新委员会、鹏城实验室等部门和单位的支持。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
城环学院李双成教授团队在Nature Energy杂志发表论文揭示气候变化对全球风光系统供需匹配的影响
北大城环学院生态研究中心领衔发表Science论文,系统评估我国城市地面沉降的格局、机制及可能影响
北京大学材料科学与工程学院郭少军团队发现稳定高价态钌催化活性位的新策略
北京大学未来技术学院陈知行课题组研发新探针实现线粒体多色STED成像
北京大学材料学院王永刚课题组通过高压调控在准一维铬基铁磁体中观测到超导
材料学院刘磊课题组在六方氮化硼材料的制备及其同位素效应研究中取得系列进展
清华大学 化学系许华平课题组在非碳主链聚合物研究方面取得新进展
第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)
第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)
2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
2024遥感与航天航空国际会议(IACRSA 2024)(2024-6-30)
2024年哲学、艺术鉴赏与数字媒体国际会议(PAADM 2024)(2024-6-29)
2024年病理学与公共卫生国际会议(ICPPH 2024)(2024-6-22)
2024年智能驾驶与交通运输国际学术会议(ICIDT 2024)(2024-6-22)
2024年电子信息工程与人工智能国际学术会议(EIEAI2024)(2024-5-30)
2024年城市工程、公共交通与管理科学国际会议(UEPTMS 2024)(2024-6-30)
2024年社会发展与现代化教育国际研讨会 (ISSDME 2024)(2024-5-29)
2024年海洋工程与环境保护国际会议(ICMEEP 2024)(2024-7-24)
第三届机电一体化与机械工程国际会议(ICMME 2024)(2024-5-24)
2024智能电网、电力系统与能源技术国际会议(ICSGPSET 2024)(2024-6-23)