[发明专利]一种人数统计方法、系统及相关装置在审
| 申请号: | 201811614788.X | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN109657186A | 公开(公告)日: | 2019-04-19 |
| 发明(设计)人: | 郑棉洲;陈昊亮 | 申请(专利权)人: | 广州势必可赢网络科技有限公司 |
| 主分类号: | G06F16/958 | 分类号: | G06F16/958;G10L17/08;G10L17/14;G06K9/62 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标语音 统计 聚类处理 人数统计 声纹特征 相似度 计算机可读存储介质 语音 人数统计系统 相关装置 语音类别 语音验证 申请 重复 | ||
本申请所提供的一种人数统计方法,包括:在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;利用声纹特征信息,计算各个目标语音之间的相似度;根据各个目标语音之间的相似度,对各个目标语音进行聚类处理,得到各个语音类别;统计语音类别的数量以确定各个目标语音所属的人的数量。可见,该方法对各个目标语音进行聚类处理,能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率。本申请还提供一种人数统计系统、设备及计算机可读存储介质,均具有上述有益效果。
技术领域
本申请涉及人数统计技术领域,特别涉及一种人数统计方法、系统、设备及计算机可读存储介质。
背景技术
目前,一些网站需要对访问人数进行统计,在语音验证过程中存在同一人多次验证的情况,造成最终验证人数统计重复的问题。也就是说,相关技术是统计通过语音验证的语音的数量作为需统计的人数,但是这些语音中可能有多个语音是同一个人发出的,同一个人被重复统计,浪费了统计成本,降低了统计效率。
因此,如何避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的是提供一种人数统计方法、系统、设备及计算机可读存储介质,能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率。
为解决上述技术问题,本申请提供一种人数统计方法,包括:
在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;
利用所述声纹特征信息,计算各个所述目标语音之间的相似度;
根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;
统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。
优选地,所述根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别,包括:
根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行AHC层次聚类处理,得到各个所述语音类别。
优选地,所述在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息,包括:
利用ASR技术将各个所述语音转化为对应的字符;
根据各个所述语音对应的字符与预设字符匹配情况,筛选出各个所述目标语音;
获取各个所述目标语音的所述声纹特征信息。
优选地,利用ASR技术将各个所述语音转化为对应的字符之前,还包括:
利用TTS检测模型检测各个所述语音的发出者是否具有生命特征信息;
若是,则执行所述利用ASR技术将各个所述语音转化为对应的字符的步骤。
本申请还提供一种人数统计系统,包括:
声纹特征信息获取模块,用于在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;
相似度计算模块,用于利用所述声纹特征信息,计算各个所述目标语音之间的相似度;
聚类处理模块,用于根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;
数量统计模块,用于统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。
优选地,所述聚类处理模块,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州势必可赢网络科技有限公司,未经广州势必可赢网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811614788.X/2.html,转载请声明来源钻瓜专利网。





