[发明专利]语音识别方法及设备在审
| 申请号: | 202010064349.7 | 申请日: | 2020-01-20 |
| 公开(公告)号: | CN112331206A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 李知炫 | 申请(专利权)人: | 三星电子株式会社 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/08;G06F40/242;G06F40/154;G06F40/157;G06F40/117 |
| 代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 刘灿强;张川绪 |
| 地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 设备 | ||
提供了一种语音识别方法及设备。所述语音识别方法包括:接收语音数据;使用语音识别模型,从接收的语音数据获得候选文本,候选文本包括至少一个词和与包括在接收的语音数据中的目标词的发音相关联的语音符号序列;用与语音符号序列对应的替换词来替换候选文本中包括的语音符号序列;和基于替换的结果来确定与接收的语音数据对应的目标文本。
本申请要求于2019年8月5日在韩国知识产权局提交的第10-2019-0094950号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及一种语音识别方法及设备。
背景技术
语音识别指的是计算机分析人类为了表达而说出的语音并将语音转换为文本数据的技术。通过来自追求便利性的用户的增长的需求,该技术正在迅速发展。使用神经网络执行语音识别的方法正在被研究。神经网络可以是通过数学的表示形式来模拟人类的生物神经元的特性并且使用模拟人类的学习能力的算法的模型。神经网络可具有基于学习或训练的结果针对尚未用于学习或训练的输入模式生成相对正确的输出的泛化能力。因此,由于这样的泛化能力,它被广泛用于语音识别的技术领域。
发明内容
提供本发明内容来以简化的形式介绍在以下具体实施方式中进一步描述的构思的选择。本发明内容不意在标识要求权利的主题的关键特征或必要特征,也不意在用于帮助确定要求权利的主题的范围。
在一个总体方面,一种语音识别方法包括:接收语音数据;使用语音识别模型,从接收的语音数据获得候选文本,候选文本包括至少一个词和与包括在接收的语音数据中的目标词的发音相关联的语音符号序列;用与语音符号序列对应的替换词来替换包括在候选文本中的语音符号序列;和基于替换的结果来确定与接收的语音数据对应的目标文本。
所述至少一个词可包括至少一个子词,并且候选文本可包括所述至少一个子词、语音符号序列、以及指示语音符号序列的开始和结束的标识符对。
替换的步骤可包括:用替换词来替换由标识符对标识的语音符号序列。
标识符对可指示与语音符号序列相关联的目标词的类别。
所述方法可包括:使用包括与多个词和分别对应于所述多个词的语音符号序列有关的信息的词典数据,来确定与语音符号序列对应的替换词。
所述方法可包括:计算包括在候选文本中的语音符号序列与包括在词典数据中的语音符号序列中的每个之间的相似度;和将与具有计算的包括在词典数据中的语音符号序列的相似度之中的最大相似度的语音符号序列对应的词确定为与包括在候选文本中的语音符号序列对应的替换词。
词典数据可具有字典树或哈希图数据结构,并且确定的步骤可包括:使用所述数据结构,从包括在词典数据中的语音符号序列检索与包括在候选文本中的语音符号序列对应的语音符号序列;和将与检索的语音符号序列对应的词确定为与候选文本中的语音符号序对应的替换词。
所述方法可包括:使用与不同类别对应的词典数据的集合之中的与由标识符对指示的类别对应的词典数据,确定与包括在候选文本中的语音符号序列对应的替换词;和用确定的替换词来替换包括在候选文本中的语音符号序列。与不同类别对应的词典数据的集合中的每个可包括与每个类别中的每个词所对应的语音符号序列有关的信息。
响应于语音符号序列对应于多个词,所述方法可包括:通过用所述多个词中的每个替换语音符号序列来获得多个候选目标文本;使用语言模型来计算所述多个候选目标文本中的每个的分数;和将具有计算的候选目标文本的分数之中的最大分数的候选目标文本确定为目标文本。
语音符号序列可与对应于专有名词的目标词的发音相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010064349.7/2.html,转载请声明来源钻瓜专利网。





