[发明专利]监室对讲机声纹识别方法、系统及存储器在审
申请号: | 202110594985.5 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113314125A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 张维锋;韦壹珍 | 申请(专利权)人: | 深圳市展拓电子技术有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/26;H04N7/18 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 吴珊 |
地址: | 518000 广东省深圳市宝安区石岩街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对讲机 声纹 识别 方法 系统 存储器 | ||
本申请公开了一种监室对讲机声纹识别方法、系统及存储器,涉及声纹识别技术领域。其方法包括基于获取的触发信息,识别从图像获取终端获取的图像以获得身份信息和活动信息;基于身份信息和活动信息匹配录入的认证信息,以输出启动声纹识别模块和语音识别模块的通话启动信息;基于声纹识别模块和语音识别模块,形成具有对讲人员的声纹身份信息和语音识别的对话记录的通话记录;基于获取的通话结束信息,获取时间信息并上传通话记录数据,本申请具有方便监室中被监管人员和监管人员的沟通内容的检索和调取的优点。
技术领域
本申请涉及声纹识别领域,尤其是涉及一种监室对讲机声纹识别方法、系统及存储器。
背景技术
监室中设置对讲机用于监室中的被监管人员和监管人员沟通。使得监管人员和被监管人员可以在空间被隔开,且彼此之间不会失去联系。
目前,针对监室内的被监管人员和监管人员的沟通内容一般需要留档存储,而语音的存储档案调取和检索都不方便,不利于目前智能化监室的建立,亟待解决。
发明内容
为了方便监室中被监管人员和监管人员的沟通内容的检索和调取,本申请提供一种监室对讲机声纹识别方法、系统及存储器。
针对现有的技术问题,本申请的目的在于提供一种监室对讲机声纹识别系统,其具有方便监室中被监管人员和监管人员的沟通内容的检索优点。
第一方面,本申请提供一种监室对讲机声纹识别方法,采用如下的技术方案:
一种监室对讲机声纹识别方法,包括:
基于获取的触发信息,识别从图像获取终端获取的图像以获得身份信息和活动信息;
基于身份信息和活动信息匹配录入的认证信息,以输出启动声纹识别模块和语音识别模块的通话启动信息;
基于声纹识别模块和语音识别模块,形成具有对讲人员的声纹身份信息和语音识别的对话记录的通话记录;
基于获取的通话结束信息,获取时间信息并上传通话记录数据。
通过采用上述技术方案,在触发数据后通过,通过图像获得身份信息和活动信息,以通过身份信息和活动信息认证,开始通话。
在开始通话后,声纹识别模块识别正在对讲的人员身份,通过语音识别模块识别的对话记录。形成文字的沟通记录,最后在通话结束上传。在整体过程中,语音的转化和身份的识别都由对讲机中控制执行。而转化后的沟通记录为文字形式,能够更轻易的被检索和调用。
优选的:所述活动信息获取包括:
识别第一时刻的图像获取终端获取的图像获得基准口型图像;
识别第二时刻的图像获取终端获取的图像获得识别口型图像;
基于比较基准口型图像和识别口型图像的特征点,确认活动信息。
通过采用上述技术方案,活动信息用于判断,获取的图像信息是否为真人。方案中通过两个时刻中口型图像的对比,看其中的特征是否有区别能够达到活动信息的确认目的。
优选的:所述基于声纹识别模块和语音识别模块,形成具有对讲人员的声纹身份信息和语音识别的对话记录的通话记录数据包括:
基于比对获取的声纹信息和预设声纹数据库内数据获取声纹身份信息;
基于获取的语音信息进行语音识别获得对话信息;
结合所述获取声纹身份信息和语音对话信息生成通话记录。
通过采用上述技术方案,通过声纹信息和声纹数据库内的信息能够直接获取到对讲双方身份信息。语音识别获取的语音信息获得通话记录,通过声纹身份信息和语音对话信息的结合就可以得到文字的通话记录。
优选的:包括所述基于获取的语音信息进行识别获得语音对话信息;
采集语音数据并进行语音识别,获得语音识别文本以及语音预测准确率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市展拓电子技术有限公司,未经深圳市展拓电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594985.5/2.html,转载请声明来源钻瓜专利网。