[发明专利]多人视频方法、装置、设备及存储介质有效
申请号: | 201811601902.5 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109817221B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 张冉 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/04;G10L13/02;G06K9/00;H04N7/14;G10L25/51 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 李伟波;韩德凯 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 方法 装置 设备 存储 介质 | ||
本公开提供了一种多人视频方法,包括:生成用户的声纹;生成用户的人像模型;为用户配置身份识别号码;通过身份识别号码,匹配用户的声纹和人像模型;通过获取说话人的声音识别说话人的声纹,调取说话人的声纹对应的身份识别号码,基于说话人的身份识别号码,调取说话人的人像模型;以及实时的合成说话人的声音和人像模型。本公开还提供了一种多人视频装置、电子设备及可读存储介质。
技术领域
本公开涉及一种多人视频方法、多人视频装置、电子设备及可读存储介质。
背景技术
视频是远程解决问题和交流感情最重要直观的方式。但现实中很多场景下,由于网速或没有摄像头等原因,无法实现视频交流。
现有技术中的视频方法或系统需要用户在摄像头范围内,不能在无摄像头情况下工作,网速要快,在有网速且有摄像头的情况下,用户也必须盯着屏幕,无法同时处理其他事情或者离开摄像头范围。
声纹是携带言语信息的声波频谱。声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。
发明内容
为了解决上述技术问题中的至少一个,本公开提供了一种多人视频方法、多人视频装置、电子设备及可读存储介质。
根据本公开的一个方面,一种多人视频方法,包括:生成用户的声纹;生成用户的人像模型;为用户配置身份识别号码;通过身份识别号码,匹配用户的声纹和人像模型;通过获取说话人的声音识别说话人的声纹,调取说话人的声纹对应的身份识别号码,基于说话人的身份识别号码,调取说话人的人像模型;以及实时的合成说话人的声音和人像模型。
根据本公开的至少一个实施方式,生成用户的声纹包括:录入用户的多个声音,并对多个声音进行训练,生成用户的声纹。
根据本公开的至少一个实施方式,生成用户的人像模型包括:录入用户的多个照片和/或视频,提取每个照片和/或视频的头部姿态特征、唇部姿态特征、脸部姿态特征和/或眼部姿态特征,基于多个照片和/或视频的头部姿态特征、唇部姿态特征、脸部姿态特征和/或眼部姿态特征,生成用户的人像模型。
根据本公开的至少一个实施方式,如果多人说话或者对话,基于各个说话人的声音识别各个说话人的声纹,基于各个说话人的声纹获取各个说话人的身份识别号码,基于各个说话人的身份识别号码,调取各个说话人的人像模型。
根据本公开的至少一个实施方式,还包括:如果多人说话或者对话,基于各个说话人的声音识别各个说话人的声纹,基于各个说话人的声纹识别各个说话人的性别,基于各个说话人的性别将说话人分为两组,对于每组说话人,基于各个说话人的声纹获取各个说话人的身份识别号码,基于各个说话人的身份识别号码,调取各个说话人的人像模型。
根据本公开的至少一个实施方式,用户的声纹和/或用户的人像模型存储在终端和/或云端。
根据本公开的至少一个实施方式,合成的说话人的声音和人像模型配置在虚拟场景中。
根据本公开的另一方面,一种多人视频装置,包括:声纹生成模块,声纹生成模块生成用户的声纹;人像模型生成模块,人像模型生成模块生成用户的人像模型;身份识别号码配置模块,身份识别号码配置模块为用户配置身份识别号码;视频模块,视频模块通过获取说话人的声音识别说话人的声纹,调取说话人的声纹对应的身份识别号码,基于说话人的身份识别号码,调取说话人的人像模型;以及实时的合成说话人的声音和人像模型。
根据本公开的又一方面,一种电子设备,包括:存储器,存储器存储计算机执行指令;以及处理器,处理器执行存储器存储的计算机执行指令,使得处理器执行上述的方法。
根据本公开的再一方面,一种可读存储介质,可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811601902.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别方法、装置及系统
- 下一篇:一种年龄识别方法、装置及终端设备