[发明专利]语义识别方法及装置有效
申请号: | 201711397017.5 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108133706B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 张立新;周毕兴 | 申请(专利权)人: | 深圳市沃特沃德股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G06F40/30 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市南山区蛇口*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 识别 方法 装置 | ||
本发明提供了一种语义识别方法及装置,包括获取待识别的语音信息;识别所述语音信息中的每个单字语音的时长;将每个所述单字语音的时长与第一预设值进行对比;根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义;根据单字语音的时长识别每个单字语音,便于区分语音信息中的数字、字母以及符号,增加识别准确度。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语义识别方法及装置。
背景技术
语音识别的应用越来越广泛,不仅在语音输入法领域得到使用,在翻译机、人工智能等应用上也日益广泛。中文汉字不算声调有400多个发音,同音不同字的情况大量存在。通常文字的内容识别可根据词语组合或上下文的意思来推理联想以提高准确率,但当识别毫无规律的数字、符号、字母时误识别率较高,常常需要人工纠错,而在无显示屏和无键盘输入装置时比较难以进行纠错操作,将会降低语音识别的准确率和识别效率。
发明内容
本发明的主要目的为提供一种语义识别方法及装置,提升语义识别准确率。
本发明提出一种语义识别方法,包括以下步骤:
获取待识别的语音信息;
识别所述语音信息中的每个单字语音的时长;
将每个所述单字语音的时长与第一预设值进行对比;
根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。
进一步地,所述对比结果为所述单字语音的时长小于所述第一预设值,所述预设语义数据库则为汉字语义库,所述汉字语义库包括预设单字语音及对应的预设汉字;
所述对比结果为所述单字语音的时长不小于所述第一预设值,所述预设语义数据库则为特征字符语义库,所述特征字符语义库包括预设单字语音及对应的预设数字、字母以及符号中至少一种。
进一步地,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤之后包括:
监听所述单字语音对应的语义是否匹配成功;
若不成功,则在所述汉字语义库中匹配所述单字语音对应的语义。
进一步地,所述在预设语义数据库中匹配所述单字语音对应的语义的步骤之后包括:
监测所述单字语音对应匹配的语义的数量;
若所述单字语音对应的语义为多个,则分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语;
若是,则分析所述词语的意思;
从所述单字语音对应的多个语义中选择与所述词语的意思相关联的语义。
进一步地,分析所述单字语音之前或之后的两个单字语音对应的两个语义在组合后是否为词语的步骤包括:
将所述单字语音之前或之后的两个单字语音对应的两个语义进行组合;
分析预设的词语数据库中是否有与所述两个语义相同的预设词语;
若有,则将所述两个语义判定为词语。
本发明还提供了一种语义识别装置,包括:
获取单元,用于获取待识别的语音信息;
第一识别单元,用于识别所述语音信息中的每个单字语音的时长;
对比单元,用于将每个所述单字语音的时长与第一预设值进行对比;
第二识别单元,用于根据对比结果,在预设语义数据库中匹配所述单字语音对应的语义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市沃特沃德股份有限公司,未经深圳市沃特沃德股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711397017.5/2.html,转载请声明来源钻瓜专利网。