[发明专利]一种语音会话样本的身份识别方法、装置及设备有效
| 申请号: | 201610865036.5 | 申请日: | 2016-09-29 |
| 公开(公告)号: | CN107886955B | 公开(公告)日: | 2021-10-26 |
| 发明(设计)人: | 雷成军;高建忠;陈鑫;程涛远;杨琳琳;黄晓梅;吴冬雪 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 会话 样本 身份 识别 方法 装置 设备 | ||
1.一种语音会话样本的身份识别方法,包括:
识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;
依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;
将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息;
所述身份分类器通过如下方式得到:
依据不同身份用户的会话文本中包含的关键字以及关键字频次,训练得到所述身份分类器。
2.根据权利要求1所述的方法,其特征在于,识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句,包括:
识别所述语音会话样本的声学特征;
依据识别结果,确定所述语音会话样本中包含的停顿信息;
依据所述停顿信息对所述语音会话样本进行语音切分,以确定所述语音会话样本中包含的会话语句。
3.根据权利要求1所述的方法,其特征在于,所述声学特征包括时长、基频、能量、共振峰频率、宽带、频率微扰、振幅微扰、过零率和梅尔频率倒谱参数中的至少一种。
4.根据权利要求1所述的方法,其特征在于,确定所述每一用户的身份信息之后,包括:
获取任一身份用户的所有语音内容;
依据获取的语音内容,为所述任一身份用户提供服务。
5.一种语音会话样本的身份识别装置,包括:
语句确定模块,用于识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;
语句聚类模块,用于依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;
身份信息确定模块,用于将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息;
分类器训练模块,用于依据不同身份用户的会话文本中包含的关键字以及关键字频次,训练得到所述身份分类器。
6.根据权利要求5所述的装置,其特征在于,所述语句确定模块包括:
声学特征识别单元,用于识别所述语音会话样本的声学特征;
停顿信息确定单元,用于依据识别结果,确定所述语音会话样本中包含的停顿信息;
语音切分单元,用于依据所述停顿信息对所述语音会话样本进行语音切分,以确定所述语音会话样本中包含的会话语句。
7.根据权利要求5所述的装置,其特征在于,所述声学特征包括时长、基频、能量、共振峰频率、宽带、频率微扰、振幅微扰、过零率和梅尔频率倒谱参数中的至少一种。
8.根据权利要求5所述的装置,其特征在于,包括服务提供模块具体用于:
在确定所述每一用户的身份信息之后,获取任一身份用户的所有语音内容;
依据获取的语音内容,为所述任一身份用户提供服务。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610865036.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:上电复位电路
- 下一篇:一种高压四断口激光触发真空开关





