[发明专利]一种使用动态贝叶斯网络模型的语音识别系统和方法有效

专利信息
申请号: 201380031695.3 申请日: 2013-06-26
公开(公告)号: CN104541324B 公开(公告)日: 2019-09-13
发明(设计)人: 巴尔托什·焦尔科;托马什·贾奇克 申请(专利权)人: 克拉科夫大学
主分类号: G10L15/14 分类号: G10L15/14
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 曾贤伟;周捷
地址: 波兰克*** 国省代码: 波兰;PL
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 使用 动态 贝叶斯 网络 模型 语音 识别 系统 方法
【说明书】:

一种用于语音识别的计算机实现的方法,包括以下步骤:通过输入设备(102A)的方式,记录(201)表示语音的电信号,并将该信号转换为频域或时‑频域(202),基于动态贝叶斯网络在分析模块中分析信号(205),被配置为基于观察到的信号特征(OA,OV)生成单词(W)的假设和它们的概率,基于特定单词(W)假设和它们的概率,识别(209)出表示语音的电信号所对应的文本。该方法的特征在于,将观察到的信号特征(308‑312)输入到分析模块(205)中,其中,所述观察到的信号特征是在至少两条并行信号处理线(204a,204b,204c,204d,201a)上,为频域或时‑频域(202)中信号而确定的,其中每条线上的时间片段都不同,以及,在分析模块(205)中对至少两个不同的时间片段分析观察到的信号特征(308‑312)之间的关系。

技术领域

本发明的目标是实现一种使用贝叶斯网络的语音识别系统和方法。特别地,涉及一种自动语音识别系统,其可以在用于广告和信息意图的对话系统中应用。对话系统的实施可以采用报亭或货摊的形式,其与顾客或观众开始一对话,并且将呈现适当的多媒体内容。

背景技术

语音识别系统在日常生活中变得越来越常见。比如,它们可以被用于信息电话中心,比如为公共交通所用。然而,这些系统仍然经常依赖于键盘和文本作为输入信息源,而不是使用语音作为输入信息源而运行。

已知各种类型的计算机化的交互报亭被用于与用户进行对话。比如,美国专利US6256046公开了一种在计算机化的报亭内的有源公共用户交互接口,其通过处理视觉数据、通过使用动作和色彩分析以检测表示用户出现的环境中的改变来感知用户。交互空间被定义,系统记录其环境的初始模型,该环境随着时间更新,以反映出不活动对象的添加或减去,并且补偿光的改变。该系统研发了针对移动对象的模型,因此当他们在交互空间的附近移动时,该系统能够跟踪用户。一立体摄像系统进一步增强了该系统感知位置和移动的能力。该报亭呈现出音频和视频的反馈来反映其“看到”了什么。

美国专利申请US20080204450公开了一种用于提供虚拟世界的系统、方法和程序产品,其中主动提供的广告被嵌入在自动虚拟角色中。所提供的系统包括:用于将广告虚拟角色引入虚拟世界的注册系统;用于定向用户虚拟角色以实现广告虚拟角色所传递的广告内容的定向系统;用于定义广告虚拟角色如何在虚拟世界中移动的移动系统;以及用于定义广告虚拟角色如何将广告内容传递给用户虚拟角色的广告传递系统。

诸如上述的已知的对话系统的缺陷包括,在与用户进行复杂对话时缺乏足够的语音识别能力。

美国专利US7203368公开了一种模式识别程序,其使用HMM(隐马尔科夫模型)和CHMM(耦合隐马尔科夫模型)形成了分级的统计模型。分级的统计模型支持具有多个超节点的父层和具有与每一个父层的超节点相关联的多个节点的子层。经过训练之后,分级统计模型使用从数据集中提取的观察矢量来寻找基本的最优状态序列片段。对该过程进行改进是很有利的。

一个比基于HMM的方案少一些限制的、更加通用的方案,是将贝叶斯网络用于语音识别。使用贝叶斯网络的方案包括动态贝叶斯网络(DBN),已经在以下出版物中被公开:

-M.Wester,J.Frankel,以及S.King所著的:″Asynchronous articulatoryfeature recognition using dynamic Bayesian networks″(Proceedings of IEICIBeyond HMM Workshop,2004)(“使用动态贝叶斯网络的异步分节特征识别”,公开于2004年HMM研讨会的IEICI会议录);

-J.A.Bilmes和C.Bartels所著的″Graphical model architectures for speechrecognition″,IEEE Signal Processing Magazine,vol.22,pp.89-100,2005(“用于语音识别的图形模型构造”,公开于IEEE信号处理杂志,2005年,vol.22,pp.89-100);

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于克拉科夫大学,未经克拉科夫大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380031695.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top