[发明专利]基于语音分析的说话者表征有效
申请号: | 200980132034.3 | 申请日: | 2009-06-17 |
公开(公告)号: | CN102124515A | 公开(公告)日: | 2011-07-13 |
发明(设计)人: | 尤阿伍·德加尼;依赛·扎姆尔 | 申请(专利权)人: | 声感有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/06;G10L15/18 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭志强 |
地址: | 以色列*** | 国省代码: | 以色列;IL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 分析 说话 表征 | ||
1.一种建立用于根据不同的行为、心理和说话风格的特征以对语音语调进行分类的语音参数参考数据库的计算机执行方法,所述计算机执行方法包括:
人工选择某一语境;
人工选择要分析的并处于所选择语境中的行为、心理和说话风格特征;
获得人们在所选择的语境中的多个语音语调;
将语音语调人工分成代表类似行为、心理和说话风格特征的组;
将所述代表类似行为、心理和说话风格特征的组中的每一段语音预处理成无声和有声片段;
将有声语音片段分成一串长度相同的块,所述块带有包括有音调和振幅参数的基本语音参数;
从基本语音参数中导出多个第二语音参数,其中所述选择的多个语音参数包括以下参数中至少一个:所述块串内的每一时间单位内所包含的平声、升调和降调趋势片段的总和,以及所述块串内的平声、升调和降调趋势片段的平均长度;和
从所述第二参数中确定每组语音所特有的第二语音参数、参数的组合和所述参数的值,其中所述特有的第二参数是所述组内语音片段所共有并代表了每一组语音的典型行为、心理或者说话风格特征。
2.根据权利要求1所述的方法,其中导出的多个第二语音参数包括以下参数中的至少一项:平均停顿长度、单位时间内的总停顿长度、短时沉默的平均长度、单位时间内短时沉默的总长度、平声片段的平均长度、单位时间内平声片段的总长度、升调片段的平均长度、单位时间内升调片段的总长度、降调片段的平均长度、单位时间内降调片段的总长度、平声片段的平均振幅偏移、升调片段的平均振幅偏移、降调片段的平均振幅偏移、单位时间内的音调差异和范围、单位时间内的音调斜率、语音信号的时间频谱形状和频谱包络样式,以及平声、升调和降调趋势的时间顺序样式。
3.一种分析说话者在特定环境和背景下的语音语调并确定说话者在所述特定的环境下的行为、心理和说话风格特征的计算机执行方法,所述计算机执行方法包括:
建立一个语音参数参考数据库以根据不同的行为、心理和说话风格特征对语音语调进行分类;
获得说话者在一个特定环境和背景下的语音语调;
将所获得语音语调预处理成无声和有声片段并把有声片段分成一串相同长度的块,所述块带有包括音调和振幅参数的基本语音参数;和
从所述基本参数中导出多个第二语音参数,其中所述多个选择的语音参数包括以下参数中至少一个:所述块串内的每一时间单位内所包含的平声、升调和降调趋势片段的总和,以及所述块串内的平声、升调和降调趋势片段的平均长度;
根据语音语调内的所述第二参数计算具有代表性的环境行为、心理和说话风格特征的特有语音参数、参数的组合以及所述参数的值;
通过将计算出的参数与预定义的参考数据库进行比较对环境行为、心理和说话风格的特征进行判断和评估;
输出判断和评估结果。
4.根据权利要求3所述的方法,其中所导出的多个第二语音参数包括以下参数中的至少一项:平均停顿长度、单位时间内的总停顿长度、短时沉默的平均长度、单位时间内短时沉默的总长度、平声片段的平均长度、单位时间内平声片段的总长度、升调片段的平均长度、单位时间内升调片段的总长度、降调片段的平均长度、单位时间内降调片段的总长度、平声片段的平均振幅偏移、升调片段的平均振幅偏移、降调片段的平均振幅偏移、单位时间内的音调差异和范围、单位时间内的音调斜率、语音信号的时间频谱形状和频谱包络样式,以及平声、升调和降调趋势的时间顺序样式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声感有限公司,未经声感有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980132034.3/1.html,转载请声明来源钻瓜专利网。