[发明专利]一种关键词检测方法和装置有效
| 申请号: | 201310355905.6 | 申请日: | 2013-08-15 | 
| 公开(公告)号: | CN104143328A | 公开(公告)日: | 2014-11-12 | 
| 发明(设计)人: | 李露;卢鲤;马建雄;孔令挥;饶丰;岳帅;张翔;刘海波;王尔玉;陈波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 | 
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L25/54;G06F17/30 | 
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张驰;宋志强 | 
| 地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 关键词 检测 方法 装置 | ||
1.一种关键词检测方法,其特征在于,该方法包括:
生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分组;
利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子;
基于惩罚因子评估所检测出的关键词。
2.根据权利要求1所述的关键词检测方法,其特征在于,所述基于惩罚因子评估所检测出的关键词包括:
预先设置关键词门限值;
利用置信度算法以及惩罚因子计算所检测出的关键词的置信度,其中当计算出的置信度低于所述关键词门限值时,去除该关键词。
3.根据权利要求1所述的关键词检测方法,其特征在于,所述生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分组包括:
初始化开始节点和结束节点,并针对每个语种信息Li执行如下步骤,其中i为语种序号:
构造语种节点NLi,并构造从开始节点到NLi的边;
加载与该语种信息Li对应的关键词列表和填充音节列表;
对所述关键词列表中的每一个关键词Kj,其中j为关键词序号,执行如下动作:
将关键词Kj转化成三音子序列,并针对每个三音子构造一个节点以形成节点序列;依次构造节点序列之间的边;构造语种节点NLi到节点序列中第一个节点的边以及节点序列中最后节点到结束节点的边;
对所述填充音节列表中的每个填充音节Fk,其中k为填充音节序号,执行如下动作:
构造填充音节Fk对应的节点NFk;
构造语种节点NLi到NFk的边和NFk到结束节点的边;
构造从结束节点到开始节点的边;
输出所述解码网络。
4.根据权利要求1所述的关键词检测方法,其特征在于,所述利用解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子包括:
在关键词检测的令牌传播过程中,当遇到语种状态节点时,比较该语种状态节点上的语种信息与令牌自带的语种信息是否匹配,如果不匹配,则对该令牌得分设置惩罚因子。
5.根据权利要求4所述的关键词检测方法,其特征在于,所述利用解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子包括:
预先设置对应于语种类别差异的惩罚因子表;
当检测出的关键词之间的语种信息不一致时,通过检索该惩罚因子表确定对检测出关键词所设置的惩罚因子。
6.根据权利要求1-5中任一项所述的关键词检测方法,其特征在于,在该解码网络中进一步利用语种信息对填充音节进行分组;
在利用所述解码网络对输入语音进行关键词检测时,其中当检测出的填充音节之间的语种信息不一致时,对与该填充音节相对应的关键词设置惩罚因子。
7.一种关键词检测装置,其特征在于,包括解码网络生成单元、关键词检测单元和关键词评估单元,其中:
解码网络生成单元,用于生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分组;
关键词检测单元,用于利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子;
关键词评估单元,用于基于惩罚因子评估所检测出的关键词。
8.根据权利要求7所述的关键词检测装置,其特征在于,
关键词评估单元,用于预先设置关键词门限值;利用置信度算法以及惩罚因子计算所检测出的关键词的置信度,其中当计算出的置信度低于所述关键词门限值时,去除该关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310355905.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种添加标点的方法和系统
 - 下一篇:一种微功耗节能显示方法
 





