[发明专利]视频会议的人脸辨识方法、服务器及计算机可读存储介质有效
| 申请号: | 201910408777.4 | 申请日: | 2019-05-16 |
| 公开(公告)号: | CN111953922B | 公开(公告)日: | 2022-05-27 |
| 发明(设计)人: | 吴俊德;石志刚;刘东林;蒙文;钟愈强 | 申请(专利权)人: | 南宁富联富桂精密工业有限公司 |
| 主分类号: | H04N7/15 | 分类号: | H04N7/15;H04L65/752;G10L25/51;G10L25/78;G06T13/20;G06T13/40 |
| 代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 李艳霞;刘永辉 |
| 地址: | 530033 广西壮族自治区南宁*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频会议 辨识 方法 服务器 计算机 可读 存储 介质 | ||
一种视频会议的人脸辨识方法。计算产生第一使用者的音频讯框的一包络曲线中的多段起音时间与多段释音时间;根据所述包络曲线的振幅决定所述第一使用者的嘴唇的张开大小,根据每一段起音时间决定所述嘴唇的张开速度,以及根据每一段释音时间决定所述嘴唇的闭合速度;根据所述第一使用者的嘴唇的所述张开大小、所述张开速度与所述闭合速度,动态校准所述第一使用者的唇形张开幅度。将校准封包信息、所述第一用户的头部转动的影像讯息及肢体摆动的影像讯息传送给远程的一第二使用者,使得三维人体模型据以于所述远程模拟出相应所述第一使用者的动作。本发明还提供一种视频会议服务器及计算机可读存储介质,可优化带宽使用率与提升使用者体验。
技术领域
本发明涉及通信技术领域,尤其涉及一种视频会议的人脸辨识方法、服务器及计算机可读存储介质。
背景技术
基于H.323通讯协议或会谈启始协议(Session Initiation Protocol,SIP)的视频会议系统使用H.261、H.263、H.264/先进视讯编码(Advanced Video Coding,AVC)、H.264高配置(High Profile)、H.264可适性视讯编码(Scalable Video Coding,SVC)、实时视讯(Real Time Video,RTV)等影像压缩技术,并且支持SVC标准,在受限的网络带宽环境也可使用。
然而,在带宽数据极度缺乏的环境或是网络忙碌的特定时段,常见以下问题。若设定视频会议为高质量影像,则实时传输影像可能会有延迟或每秒显示张数(Frame PerSecond,FPS)(或称,画面更新率)不足的情况。若为了保持视频会议流畅度而降低影像分辨率,则用户会明显感觉到传输影像的质量下降。另外,还可能会有网络等待时间时间增加以及视讯影像与语音不同步(Lip Syc)的问题。
发明内容
鉴于以上内容,有必要提供一种视频会议的人脸辨识方法与使用所述方法的视频会议服务器,可减少带宽使用,使得在低带宽的环境下提高视频会议的传输影像质量。
本发明实施例提供一种视频会议的人脸辨识方法,应用于视频会议装置或视频会议服务器中,包括下列步骤:判断是否曾经取得本地端的第一使用者的三维人体模型;若曾经取得所述第一使用者的三维人体模型,则从历史数据库中取得所述第一使用者的第一三维人体模型;根据所述第一使用者的发声取得多个音频讯框,并自所述多个音频讯框过滤出声音频率在特定范围内的多个第一音频讯框;计算产生所述多个第一音频讯框的包络曲线,并计算所述包络曲线中的多段起音时间与多段释音时间;根据所述包络曲线的振幅决定所述第一使用者的嘴唇的张开大小,根据每一段起音时间决定所述嘴唇的张开速度,以及根据每一段释音时间决定所述嘴唇的闭合速度;根据所述第一使用者的嘴唇的所述张开大小、所述张开速度与所述闭合速度,动态校准所述第一使用者的唇形张开幅度;以及将校准封包信息、所述第一用户的头部转动的影像讯息及肢体摆动的影像讯息传送给远程的第二使用者,使得所述三维人体模型根据所述校准封包信息、所述头部转动的影像讯息及所述肢体摆动的影像讯息于所述远程仿真出相应所述第一使用者的动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南宁富联富桂精密工业有限公司,未经南宁富联富桂精密工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910408777.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输液袋分拣设备
- 下一篇:共享车管理装置、方法、系统及停车管理系统





