[发明专利]触控辅助的实时语音识别系统及其同步解码方法有效
申请号: | 201210127297.9 | 申请日: | 2012-04-27 |
公开(公告)号: | CN102708862A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 俞凯;王欢良 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215123 江苏省苏州市工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助 实时 语音 识别 系统 及其 同步 解码 方法 | ||
1.一种触控辅助的实时语音识别系统,包括:
触控动作检测单元,用于实时检测用户的触控操作,如果有预先定义的触控操作发生,抽取触控动作特征,该触控动作特征至少包括接触点位置坐标的时间序列,触控开始点时间和结束点时间;
触控动作辨识单元,用于利用所述触控动作检测单元抽取的用户触控动作特征对用户触控动作进行分类,得到该动作所表示的含义,输出表示该动作含义的特征向量;
语音端点检测单元,用于实时检测语音信号的有效开始点和结束点,进而启动或停止语音特征提取单元;
语音特征提取单元,用于实时提取语音信号的声学特征,该声学特征用于进行语音识别;
语音/动作同步解码单元,用于实时利用用户触控动作信息,对语音特征进行在线同步解码,输出语音识别结果。
2.如权利要求1所述的触控辅助的实时语音识别系统,其中用户触控动作的输入和语音输入是实时同步的,并且每个动作在时间上对应于一个特定语音单元;所述特定语音单元包括但不限于音素、音节、词或者句子等。
所述用户触控动作是指用户手指和触摸屏接触期间的移动轨迹。
3.如权利要求1所述的触控辅助的实时语音识别系统,其中所述动作检测单元可以检测到用户手指接触利离开触摸屏的时间以及手指接触屏幕期间的每个位置坐标,从接触屏幕到离开的触点位置坐标形成一个时间序列。
4.如权利要求1所述的触控辅助的实时语音识别系统,其中所述动作辨识单元根据用户手指触控位置或移动轨迹来判断用户动作所表示的含义,通常为用户动作所表示的若干语言或语音相关的符号。
5.如权利要求4所述的触控辅助的实时语音识别系统,其特征在于所述动作辨识单元所输出的用户动作的含义通常表示为若干特定语言或语音相关的符号的置信度向量。
6.如权利要求1所述的触控辅助的实时语音识别系统,其中所述语音端点检测单元可以采用用户触控动作来实现语音端点的实时检测,主要包括:首先定义特定的用户触控动作来表示语音起始点和结束点,然后通过检测预定义的用户触控动作来标识用户语音的开始点和结束点。
7.如权利要求1所述的触控辅助的实时语音识别系统,其中所述语音/动作同步解码单元的语音/动作同步解码的过程可用下述公式实现:
其中:S表示所有所有可能的词串集合,O=[o1,...,oT]表示声学观察序列,A=[a1,...,aT]表示观察到的用户动作特征序列,P(O |W)表示给定词串W产生声学观察O的概率,P(W)表示词串W出现的概率,P(A|W,O)表示给定词串W和声学观察序列O产生用户动作序列A的概率,α、β和γ分别为声学模型概率、语言模型概率和用户动作概率的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210127297.9/1.html,转载请声明来源钻瓜专利网。