[发明专利]基于语音分析的说话者表征有效
申请号: | 200980132034.3 | 申请日: | 2009-06-17 |
公开(公告)号: | CN102124515A | 公开(公告)日: | 2011-07-13 |
发明(设计)人: | 尤阿伍·德加尼;依赛·扎姆尔 | 申请(专利权)人: | 声感有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/06;G10L15/18 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭志强 |
地址: | 以色列*** | 国省代码: | 以色列;IL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 分析 说话 表征 | ||
技术领域
本发明涉及语音分析领域,特别是使用语音的韵律特征判断人在特定环境下的行为、心理和语言风格特征。
背景技术
语音分析是用于处理人类语音以揭露其意义的电脑化方法的一个统称。语音分析通常归类于语言科学中的语音学的一部分。
语音分析可以分为两种主要的方法:第一种方法致力于通过学习文字、音节和音素的发音和句子的排列来揭露语音内容。许多语音识别应用,比如“语音文字转换”或者“文字识别”,均使用了此方法来提取语音的内容。
第二种方法为语音的韵律分析,其致力于分析语音的非音段(非词语、非内容)的特征,比如语调、语速、感情的强烈程度、重音和节奏,以研究人们的说话方式。
这里所述的说话方式提供了语音的“旋律”,所述“旋律”有助于深入理解语音的整体意义和背景。比如,人们通过一个句尾的升调来感知一个问句。腔调是经典的关于韵律语音参数如何改变说话发音的一个例子。演员们改变他们的腔调使其听起来象是某个角色。韵律还存在着性别差异,例如,女性通常有比男性更高频率的声调。许多时候,韵律特征改变了言语的意思:我们可以通过改变发音方式(韵律)将一个同样的句子演绎成带有怀疑、讽刺或者其它简单意思的句子。
说话语调的韵律特征还包含了关于讲话者的情感信息。这可以在这些年来的研究文献中看到。这是非常直观的—一个激动的人在打应急服务电话时的语速通常都是非常快的,他的声音会是紧张的、带呼吸声的、有波动的等等。另一方面,一个处于悲伤失望中的人会倾向于比较缓慢地说话,缺乏活力并带有长停顿以及类似特征。这些特征均反应在语音的韵律特征上。
已经有数个关于使用韵律上的语音特征自动分析讲话者的情感状态的专利被公开。其中,Pertrushin的美国专利6151571和Slaney的美国专利6173260用于分类不同的情感状态,Degani和Zamir的欧洲专利1423846用于确认普通的情绪唤起。所有的专利在这里组成一个整体作为参考。
人们尝试把说话者的个性和谈话的韵律特征关联到一起。Bogdashevsky的美国专利6006188描述了这样一种方法,所述方法测定带有类似性格类型的人们的语音特征(根据已知的心理感觉测验),然后使用检测到的特征进行性格类型分类。言谈反映个性这一观点是讲得通的而且非常直观:比如我们可以想象一个性格内向的人的讲话方式是温和而且犹豫的,这与性格外向的人的响亮而且冲动的讲话方式是相反的。
将性格和讲话方式结合到一起很好地反映了我们对于言谈广泛地表达了个人特征的理解。然而,此观点的缺陷在于其具体实施。性格代表了一个人稳定的特征,这样其应该被始终如一地评估。这意味着说话者的反映其性格的讲话方式应该在不断改变的环境、多变的心理状态和不同的背景下保持始终如一。这并不符合实际:讲话方式会被环境因素严重影响,例如,已经证明了情绪状态和讲话腔调之间的牢固关系。即使上述例子中的性格内向的人也会时不时变得愤怒,此时他的讲话方式(和他的韵律上的语音特征)会发生极大的改变并且变得类似于一个性格开朗外向的人的讲话方式。在统计上,如果我们评估性格内向的人在不同的场合的讲话方式,我们或许会发现他的性格和讲话方式之间存在着可观的联系。我们只有在与参考数据被采集的情况非常类似的情况下的言谈进行采样,结果才有可能是可靠的。但这样做当环境因素在其间起主导作用时是不符合实际的。在实际生活中,环境因素频繁地影响我们的言谈。这样,基于语音韵律的性格评估并不能作为一种与环境无关的方法。
发明内容
本发明提出了一计算机执行方法、数据处理系统、计算机程序的产品和装置,它们通过分析讲话者的语调以确定讲话者在特定情形和背景下的当前行为和心理特征,同时还确定了说话者当前说话风格。
所述分析基于计算说话者的基本音调和振幅参数的特有的二阶导数(secondary derivative),当其整体使用时标示了说话者在特定环境和背景下的当前行为、心理和说话风格特征。
对当前行为、心理和讲话风格特征的分类通过将说话者的评估了的第二语音参数与预先得到的数据进行比较而得以实现,所述预先得到的数据代表了在一定范围的环境和背景下不同的行为、心理和讲话风格特征的所述第二语音参数值以及所述参数值的组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声感有限公司,未经声感有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980132034.3/2.html,转载请声明来源钻瓜专利网。