[发明专利]确定目标识别文本的方法及装置有效

申请号：	201710127503.9	申请日：	2017-03-06
公开（公告）号：	CN106782560B	公开（公告）日：	2020-06-16
发明（设计）人：	陈仲帅;马宏	申请（专利权）人：	海信集团有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G06F40/279;G06F16/35
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	张洋;黄健
地址：	266071 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	确定目标识别文本方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种确定目标识别文本的方法及装置，该方法包括：确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，确定识别文本为至少两个候选识别文本中相同的部分，待确定识别文本为至少两个候选识别文本中不相同的部分；计算待确定识别文本与目标对比文本的对应位置的文本之间的相似度，目标对比文本为预设文本库中与候选识别文本的句型结构一致的文本，且目标对比文本包括确定识别文本；进而将相似度中的最大值对应的待确定识别文本与确定识别文本组成的候选识别文本，配置为目标识别文本；实现了从候选识别文本中进一步筛选目标识别文本，提高了目标识别文本的准确性。

技术领域

本申请涉及语音识别技术，尤其涉及一种确定目标识别文本的方法及装置。

背景技术

随着语音控制技术的发展，目前越来越多的智能设备具备语音识别功能，示例的，具备语音控制功能的智能电视、智能冰箱、智能空调等和具备语音输入功能的智能手机智能电脑等。

目前的语音识别主要包含语音预处理、声学模型解码、发音词典解析、语言模型解码等过程，其中，语音预处理是将收到的语音信号进行简单的处理，得到语音的特征文件等；声学模型解码的输入是语音的特征文件，通过声学模型解码获取概率最高的音素文件；进而，通过查询发音词典，将音素信息转为成可能的文字组合，再通过语言模型的上下文关联信息，从文字组合中获取概率较高的文字组合信息作为候选识别结果。由于语言模型中语料来源较为广泛，候选识别结果无法保证识别结果的准确性，因此需要通过一些方法从中甄别出准确的识别结果。

但是，现有技术中并没有合适的甄选方法。

申请内容

本申请提供一种确定目标识别文本的方法及装置，用于在待识别语音数据的候选识别结果中甄选出准确的识别结果。

本申请第一方面提供一种从至少两个候选识别文本中确定目标识别文本的方法，包括：

确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，所述确定识别文本为至少两个所述候选识别文本中相同的部分，所述待确定识别文本为至少两个所述候选识别文本中不相同的部分；

计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度，其中，所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本，且所述目标对比文本包括所述确定识别文本；

将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本，配置为目标识别文本。

本申请第二方面提供一种从候选识别文本中确定目标识别文本的装置，包括：

第一确定模块，用于确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，所述确定识别文本为至少两个所述候选识别文本中相同的部分，所述待确定识别文本为至少两个所述候选识别文本中不相同的部分；

计算模块，用于计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度，其中，所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本，且所述目标对比文本包括所述确定识别文本；

第二确定模块，用于将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本，配置为目标识别文本。

本申请的有益效果如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于海信集团有限公司，未经海信集团有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710127503.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]确定目标识别文本的方法及装置有效

专利文献下载