[发明专利]中文热词检测方法和装置有效
| 申请号: | 201510031181.9 | 申请日: | 2015-01-21 |
| 公开(公告)号: | CN105869622B | 公开(公告)日: | 2020-01-17 |
| 发明(设计)人: | 雷欣;李倩 | 申请(专利权)人: | 上海羽扇智信息科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04;G10L15/14;G10L25/54 |
| 代理公司: | 11577 北京知呱呱知识产权代理有限公司 | 代理人: | 冯建基;孙进华 |
| 地址: | 201203 上海市浦东新区张*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种中文热词检测方法和装置。该方法包括:收集用户语音的连续的多个片段;参照目标中文热词中每个字的标准语音特征,获取目标中文热词中各个字在每个片段中出现的概率;基于上述目标中文热词中各个字在每个片段中出现的概率,获取在不违背目标中文热词的字的标准前后顺序的前提下所述多个片段中出现该目标中文热词的最大概率;基于所述最大概率检测在用户语音中是否有目标中文热词。本发明能够支持以字为分割单位的中文热词检测,并保证检测出的热词与目标中文热词中的字的顺序一致。 | ||
| 搜索关键词: | 中文 检测 方法 装置 | ||
【主权项】:
1.一种中文热词检测方法(1),包括:/n收集用户语音的连续的多个片段(110);/n参照目标中文热词中每个字的标准语音特征,获取目标中文热词中各个字在每个片段中出现的概率(120);/n基于上述目标中文热词中各个字在每个片段中出现的概率,获取在不违背目标中文热词的字的标准前后顺序的前提下所述多个片段中出现该目标中文热词的最大概率(130);/n基于所述最大概率检测在用户语音中是否有目标中文热词(140);/n其中获取在不违背目标中文热词的字的标准前后顺序的前提下所述多个片段中出现该目标中文热词的最大概率的步骤(130)是通过基于时间的隐藏马尔科夫模型实现的,其中在所述基于时间的隐藏马尔科夫模型中,以目标中文热词的字的标准前后顺序,限制所述基于时间的隐藏马尔科夫模型在各个连续片段间出现的目标中文热词中的字之间的转移路径;所述最大概率的算法是将所述转移路径中所有字出现概率进行等权相加再除以转移路径中字的个数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海羽扇智信息科技有限公司,未经上海羽扇智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510031181.9/,转载请声明来源钻瓜专利网。
- 上一篇:语音识别装置及语音识别方法
- 下一篇:石油产品铜片腐蚀试验用金属浴





