[发明专利]评价口语能力的方法和系统无效
| 申请号: | 201010002954.8 | 申请日: | 2010-01-15 |
| 公开(公告)号: | CN101782941A | 公开(公告)日: | 2010-07-21 |
| 发明(设计)人: | O·D·德什姆克;A·维尔马 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00;G10L15/22 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 高青 |
| 地址: | 美国*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 评价 口语 能力 方法 系统 | ||
1.一种用于评价讲话者的一个或多个口语语言能力的方法,包含如下步骤:
标识讲话者所讲的语段中的一个或多个感兴趣时间位置;
计算一个或多个声学参数,其中所述一个或多个声学参数捕获所述一个或多个感兴趣时间位置的一个或多个声学-语音学特征的一个或多个特性;以及
将所述一个或多个声学参数与自动语音识别器的输出相结合,以修改口语语言能力评价的输出。
2.如权利要求1所述的方法,其中,所述标识讲话者所讲的语段中的一个或多个感兴趣时间位置包含:定位一个或多个感兴趣音素。
3.如权利要求1所述的方法,其中,所述标识讲话者所讲的语段中的一个或多个感兴趣时间位置包含:定位样本语段与所述讲话者所讲的所述语段之间的一个或多个声学相异。
4.如权利要求1所述的方法,其中,所述标识讲话者所讲的语段中的一个或多个感兴趣时间位置包含:从一组一个或多个声学相似选项中标识所讲话语。
5.如权利要求1所述的方法,其中,将所述一个或多个声学参数与自动语音识别器的输出相结合包含:将有关从所述一个或多个声学参数中获得的语音区域的声学特性的信息与从语音识别系统中获得的声学特性相结合。
6.如权利要求1所述的方法,其中,计算一个或多个声学参数包含:计算确定摩擦音、元音和闭塞爆破音的发生之间的一个或多个谱差异的声学参数。
7.如权利要求1所述的方法,其中,所述讲话者的一个或多个口语语言能力包含所述讲话者的语法能力和所述讲话者的发音能力中的至少一个。
8.如权利要求1所述的方法,进一步包含使用来自自动语音识别系统的时间对准信息来提高识别准确性。
9.如权利要求8所述的方法,进一步包含允许来自自动语音识别系统的所述时间对准信息存在一定的双向时间容限。
10.如权利要求1所述的方法,其中,所述讲话者所讲的语段中的一个或多个感兴趣时间位置包含与一组预定的一个或多个冲击音相对应的一个或多个区域。
11.如权利要求1所述的方法,其中,所述讲话者所讲的语段中的一个或多个感兴趣时间位置包含一个或多个声学相异明显的一个或多个区域。
12.如权利要求1所述的方法,进一步包含言语残疾人士的语音概况描述。
13.一种用于评价讲话者的一个或多个口语语言能力的系统,包含:
存储器;和
与所述存储器耦合的至少一个处理器,操作用于:
标识讲话者所讲的语段中的一个或多个感兴趣时间位置;
计算一个或多个声学参数,其中所述一个或多个声学参数捕获所述一个或多个感兴趣时间位置的一个或多个声学-语音学特征的一个或多个特性;以及
将所述一个或多个声学参数与自动语音识别器的输出相结合,以修改口语语言能力评价的输出。
14.如权利要求13所述的系统,其中,在标识讲话者所讲的语段中的一个或多个感兴趣时间位置的过程中,与所述存储器耦合的所述至少一个处理器进一步操作用于定位一个或多个感兴趣音素。
15.如权利要求13所述的系统,其中,在标识讲话者所讲的语段中的一个或多个感兴趣时间位置的过程中,与所述存储器耦合的所述至少一个处理器进一步操作用于定位样本语段与所述讲话者所讲的所述语段之间的一个或多个声学相异。
16.如权利要求13所述的系统,其中,在所述计算一个或多个声学参数的过程中,与所述存储器耦合的所述至少一个处理器进一步操作用于计算确定摩擦音、元音和闭塞爆破音的发生之间的一个或多个谱差异的声学参数。
17.如权利要求13所述的系统,其中,所述讲话者的一个或多个口语语言能力包含所述讲话者的语法能力和所述讲话者的发音能力中的至少一个。
18.如权利要求13所述的系统,其中,与所述存储器耦合的所述至少一个处理器进一步操作用于使用来自自动语音识别系统的时间对准信息来提高识别准确性。
19.一种用于评价讲话者的一个或多个口语语言能力的装置,所述装置包含:
用于标识讲话者所讲的语段中的一个或多个感兴趣时间位置的部件;
用于计算一个或多个声学参数的部件,其中所述一个或多个声学参数捕获所述一个或多个感兴趣时间位置的一个或多个声学-语音学特征的一个或多个特性;以及
将所述一个或多个声学参数与自动语音识别器的输出相结合,以修改口语语言能力评价的输出的部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010002954.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





