[发明专利]一种语音会话样本的身份识别方法、装置及设备有效

申请号：	201610865036.5	申请日：	2016-09-29
公开（公告）号：	CN107886955B	公开（公告）日：	2021-10-26
发明（设计）人：	雷成军;高建忠;陈鑫;程涛远;杨琳琳;黄晓梅;吴冬雪	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L17/00	分类号：	G10L17/00;G10L17/02;G10L17/04
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆;胡彬
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音会话样本身份识别方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音会话样本的身份识别方法，包括：

识别语音会话样本的声学特征，并依据识别结果，确定所述语音会话样本中包含的会话语句；

依据所述语音会话样本中包含的会话语句的声学特征，对不同用户的会话语句进行聚类；

将每一用户的会话语句翻译成会话文本，并基于预先训练得到的身份分类器，确定所述每一用户的身份信息；

所述身份分类器通过如下方式得到：

依据不同身份用户的会话文本中包含的关键字以及关键字频次，训练得到所述身份分类器。

2.根据权利要求1所述的方法，其特征在于，识别语音会话样本的声学特征，并依据识别结果，确定所述语音会话样本中包含的会话语句，包括：

识别所述语音会话样本的声学特征；

依据识别结果，确定所述语音会话样本中包含的停顿信息；

依据所述停顿信息对所述语音会话样本进行语音切分，以确定所述语音会话样本中包含的会话语句。

3.根据权利要求1所述的方法，其特征在于，所述声学特征包括时长、基频、能量、共振峰频率、宽带、频率微扰、振幅微扰、过零率和梅尔频率倒谱参数中的至少一种。

4.根据权利要求1所述的方法，其特征在于，确定所述每一用户的身份信息之后，包括：

获取任一身份用户的所有语音内容；

依据获取的语音内容，为所述任一身份用户提供服务。

5.一种语音会话样本的身份识别装置，包括：

语句确定模块，用于识别语音会话样本的声学特征，并依据识别结果，确定所述语音会话样本中包含的会话语句；

语句聚类模块，用于依据所述语音会话样本中包含的会话语句的声学特征，对不同用户的会话语句进行聚类；

身份信息确定模块，用于将每一用户的会话语句翻译成会话文本，并基于预先训练得到的身份分类器，确定所述每一用户的身份信息；

分类器训练模块，用于依据不同身份用户的会话文本中包含的关键字以及关键字频次，训练得到所述身份分类器。

6.根据权利要求5所述的装置，其特征在于，所述语句确定模块包括：

声学特征识别单元，用于识别所述语音会话样本的声学特征；

停顿信息确定单元，用于依据识别结果，确定所述语音会话样本中包含的停顿信息；

语音切分单元，用于依据所述停顿信息对所述语音会话样本进行语音切分，以确定所述语音会话样本中包含的会话语句。

7.根据权利要求5所述的装置，其特征在于，所述声学特征包括时长、基频、能量、共振峰频率、宽带、频率微扰、振幅微扰、过零率和梅尔频率倒谱参数中的至少一种。

8.根据权利要求5所述的装置，其特征在于，包括服务提供模块具体用于：

在确定所述每一用户的身份信息之后，获取任一身份用户的所有语音内容；

依据获取的语音内容，为所述任一身份用户提供服务。

9.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610865036.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载