[发明专利]一种重音预测方法、装置、设备及存储介质在审
申请号: | 202111628589.6 | 申请日: | 2021-12-28 |
公开(公告)号: | CN114722807A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 张逸杰;刘聪;江源;祖漪清;高丽 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/253;G10L13/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 耿苑 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重音 预测 方法 装置 设备 存储 介质 | ||
本申请提供了一种重音预测方法、装置、设备及存储介质,其中,方法包括:获取待预测重音的文本数据;对文本数据进行分词,得到分词单元;对每个分词单元进行词干词缀切分,并将每个分词单元与前后相邻分词单元的词缀进行拼接,得到文本数据对应的拼接结果;根据文本数据对应的拼接结果,预测文本数据中每个分词单元的重音位置。本申请提供的重音预测方法将文本数据的每个分词单元与前后相邻分词单元的词缀进行拼接,相当于针对文本数据中的每个分词单元引入了语境信息,在对每个分词单元进行重音预测时,引入语境信息能够较好的区分同形异音词,进而准确地预测出重音位置。
技术领域
本申请涉及语音合成技术领域,尤其涉及一种重音预测方法、装置、设备及存储介质。
背景技术
预测文本数据中的重音位置是语音合成至关重要的一步。现有的重音预测方案主要为,根据待预测重音的文本数据中每个词条的文本特征(比如,词条本身、词条长度、词条的词性等)预测每个词条的重音位置。
现有的重音预测方案虽然能够预测出文本数据的重音位置,但是,其对于同形异音词的预测准确度不高。可以理解的是,重音位置预测的正确与否直接影响合成语音的可懂度和表现力,若重音位置预测错误,将直接影响后+ 续合成语音的质量。
发明内容
有鉴于此,本申请提供了一种重音预测方法、装置、设备及存储介质,用以解决现有的重音预测方案对于同形异音词的预测准确度不高的问题,其技术方案如下:
一种重音预测方法,包括:
获取待预测重音的文本数据;
对所述文本数据进行分词,得到分词单元;
对每个分词单元进行词干词缀切分,并将每个分词单元与前后相邻分词单元的词缀进行拼接,得到所述文本数据对应的拼接结果;
根据所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置。
可选的,所述根据所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置,包括:
利用预先构建的重音预测模块和所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置。
可选的,所述利用预先构建的重音预测模块和所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置,包括:
对所述文本数据对应的拼接结果中的每个拼接单元进行独热编码;
将所述每个拼接单元的编码结果输入预先构建的重音预测模块,得到所述每个拼接单元对应的重音预测结果,其中,所述重音预测结果用于指示对应的拼接单元所包含的每个字符处是否为重音位置;
根据所述每个拼接单元对应的重音预测结果,确定所述文本数据中每个分词单元的重音位置。
可选的,所述对所述文本数据对应的拼接结果中的每个拼接单元进行独热编码,包括:
根据构建的状态集,对所述文本数据对应的拼接结果中的每个拼接单元进行独热编码;
其中,所述状态集为由指定字符和所述文本数据所属语种包含的字符组成的字符集合,所述指定字符包括分词符、词干词缀分隔符和无词缀提示符。
可选的,所述将每个分词单元与前后相邻分词单元的词缀进行拼接,包括:
针对所述文本数据中的每个分词单元:
若该分词单元之前不存在可拼接词缀,该分词单元之后存在可拼接词缀,则将该分词单元之后的可拼接词缀拼接在该分词单元的后面;
若该分词单元之前存在可拼接词缀,该分词单元之后不存在可拼接词缀,则将该分词单元之前的可拼接词缀拼接在该分词单元的前面;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111628589.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种设施番茄的绿色栽培方法
- 下一篇:流体处理装置以及其控制方法