[发明专利]基于自动分类技术的语音意图判定识别方法无效
申请号: | 201310437722.9 | 申请日: | 2013-09-24 |
公开(公告)号: | CN103474065A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 李建洲;杨兴荣 | 申请(专利权)人: | 贵阳世纪恒通科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/00 |
代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 赵彦栋 |
地址: | 550022 贵州省贵阳市*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自动 分类 技术 语音 意图 判定 识别 方法 | ||
技术领域
本发明涉一种基于自动分类技术的语音意图判定识别方法,属于语音识别技术领域。
背景技术
语音识别技术是语音意图判定的基础技术,实现从语音到文字的转换。近年来,语音识别技术发展非常迅速,识别能力得到了很大的提高。随着移动互联网的兴起,语音识别技术也逐渐进入了应用市场,成为了移动应用除了文字输入之外的另一个入口。然而,这些应用都局限于用户配合的应用场景,对于用户的语音输入的稳定性和输入质量都有较高要求。由于用户语音存在口音大、噪音大、窄带失真率高、用户说话不规范等特点,语音识别的结果一直停留在一个很低的水平,这在很大程度上限制了语音识别系统的准确率。
发明内容
本发明解决的技术问题是:为了解决语音识别准确性不高的问题,本发明提供了一种基于自动分类技术的语音意图判定识别方法,从而更好地保证通过语音判定用户意图进而进一步提高语音识别准确性。
本发明的技术方案:为达到上述发明目的,本发明提出了基于自动分类技术的语音意图判定识别方法,该方法是先采用语音识别模块对输入语音进行降噪、特征提取处理,将输入语音转化为特征序列,并采用隐马尔科夫连续语音识别器进行语音识别,将语音特征序列转化为带有置信度的词图网络;然后用意图分类模块将用户语音的词图网络转化为带权重的空间向量,并利用意图分类模块中训练好的意图分类器进行意图自动分类,实现从语音到意图的转化,最后根据意图所对应字符库领域选择出最为正确的文字,形成高准确率的语音识别。
前述的基于自动分类技术的语音意图判定识别方法是,训练意图分类器的具体做法包括以下步骤
a收集并截取大量包含用户意图的语音,人工标注用户语音中所包含的用户意图类别,得到大量带有意图标注的用户语音;
b将带有意图标注的用户语音,通过语音识别技术,将每一个用户语音转化为带有置信度的词图网络。
c针对词图网络,采用特征选择和特征抽取技术,从词图网络中选择最有代表性的特征,并实现从词图网络到特征向量的映射;
d对于从每一个用户语音得到的特征向量,将其与对应的用户意图类别进行关联,并训练两者之间的映射模型,即意图分类器模型。
前述的基于自动分类技术的语音意图判定识别方法是,所述的字符库领域包括生活、美食、机械、化工、电子产品、影视、明星等进行分类。
前述的基于自动分类技术的语音意图判定识别方法是,每获取一句用户语音后,意图分类模块会对用户语音分类细化,获取更精细的字符库领域,并调整前期识别文字中的错误。
前述的基于自动分类技术的语音意图判定识别方法是,用语音识别模并不产生最终的识别结果,而是用于获取带权重的词图网络。
相比于现有语音识别方法,本发明提供的方法有如下有益效果:
(1)由于在语音识别结果正确率不高,无法在这些含错的文字上面采用自然语言处理技术分析用户意图。本发明提出了 基于容错率较高的自动分类技术替代自然语言处理技术进行语音意图判定的方法。由于自动分类技术忽略文字间的结构关系,而是采用相似度计算实现用户语音到意图之间的映射,有利于降低错误识别的文字对用户意图的干扰。
(2)目前,大多数语音识别的应用,都围绕在通过语音识别获取文字信息后,使用文字信息进行后继的加工处理。这一点在文字信息正确率较高时,由于文字信息传递的用户意图足够正确,使得它比较适用。当文字信息识别率较低时,大量的有用信息在识别过程中被语音识别搜索算法错误丢弃,导致文字信息传递的用户意图也同样丢失在识别过程中。本技术发明提出了以语音识别过程中的词图网络替代传统的文字信息作为识别结果,它能够降低语音识别搜索算法对用户意图信息的丢弃概率,使得用户意图信息在语音识别阶段得以最大化的保存。当词图网络结果传递到意图分类模块后,这些保存下来的用户意图信息,将通过意图分类器得到正确的判定。
附图说明
图1是训练意图分类器的训练流程图;
图2是语音识别产生的词图网络结构示例;
图3是意图判定服务应用流程图。
具体实施方式
为更好地理解本发明,下面结合具体实施方式及附图对本发明进行更为详细描述。在以下的描述中,当已有的现有技术的详细描述也许会淡化本发明的主题内容时,这些描述在这儿将被忽略。
基于自动分类技术的语音意图判定识别方法可以分为以下两个模块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵阳世纪恒通科技有限公司,未经贵阳世纪恒通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310437722.9/2.html,转载请声明来源钻瓜专利网。