[发明专利]一种基于人工智能的视频通讯数据高效压缩方法和系统有效
申请号: | 202110647975.3 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113382263B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 李一方;姜善宸;于大为;孙娜 | 申请(专利权)人: | 青岛海洋科学与技术国家实验室发展中心 |
主分类号: | H04N19/70 | 分类号: | H04N19/70;G06V40/20;G06T7/11 |
代理公司: | 郑州芝麻知识产权代理事务所(普通合伙) 41173 | 代理人: | 张雯雯 |
地址: | 266200 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 视频 通讯 数据 高效 压缩 方法 系统 | ||
本发明提出了一种基于人工智能的视频通讯数据高效压缩方法和系统。方法包括:将视频帧中唇部感兴趣区域划分为第一区域、第二区域;确定网格划分参数,对唇部感兴趣区域进行网格划分;第一区域、第二区域对应网格的相似度得到第一矩阵;连续两帧对应第一矩阵的元素差异得到差异矩阵,根据差异矩阵对两帧视频帧分别赋值得到两帧的遮罩图像;根据两帧的遮罩图像对原视频帧分别处理得到两帧的运动感知图像;对运动感知图像分析,得到唇部是否运动的输出,根据输出的变化选择待压缩视频帧。本发明提高了唇部运动分析的精度和准确率,提高了视频通讯过程中视频的压缩效率,使视频通讯中视频信息更加完整。
技术领域
本申请涉及视频通讯及人工智能领域,具体涉及一种基于人工智能的视频通讯数据高效压缩方法和系统。
背景技术
随着互联网行业的快速发展,视频通讯作为主流的一种通讯方法不论在生活或者工作中都显得更加重要,相比于只有文字信息或者语音信息,视频通讯能给我们带来更直观,信息内容更丰富的通信体验。而视频通讯过程中主要使用到的技术有视频、音频压缩技术和端到端或者端到多端通信技术等,在这些技术的组合下,带来的是可以随时随地的使用PC、手机、其他带有视频通话功能的终端进行视频通讯。在这些技术中,视频压缩是很重要的一项技术,视频压缩方法的优劣决定了通话过程中视频数据传输码率的大小,也就是其所占用通信资源的多少,而高效的视频压缩方法能够有效的降低通信过程中所占用的带宽,使通信更加流畅,现有的视频压缩方法主要有JPEG、JVT、MPEG、H.261等,这些压缩方法已经能够获得很好的压缩比,但对于一般网络的带宽而言,所传输的视频流仍然较大,这时视频流传输会变的十分拥堵,从而导致视频通讯出现卡顿,画质模糊等情况。
为了解决视频通讯中视频压缩的问题,有人提出了可以通过分析视频中的运动情况来判断当前视频帧是否需要进行压缩传输,从而控制视频通话过程中视频帧的压缩,例如CN100459711C,提出了一种基于头部运动分析及面部动作分析来控制视频压缩方法,当检测到当前帧图像有大幅度运动时,就对当前帧进行压缩传输,否则不进行压缩传输。
现有技术存在以下缺陷:仅对大幅运动的视频帧进行压缩传输,视频质量低,不能满足特殊人群(例如听说障碍的特殊人群)的视频通讯要求。
此外,现有运动检测通常是基于图像信息,如灰度、光流等信息进行运动检测,例如使用帧差法提取运动信息并进行识别,对光照的变化干扰不敏感,但是对目标的检测不准确,对于缓慢运动的目标甚至可能无法提取出目标边界,对于快速运动的目标提取出的目标区域又过大,无法准确分辨小目标是否运动。
发明内容
针对上述问题,本发明提出了一种基于人工智能的视频通讯数据高效压缩方法,所采用的技术方案如下:
通过唇部对称线以及过口角点唇部对称线的平行线将视频帧中唇部感兴趣区域划分为第一区域、第二区域;
根据第一区域与第二区域中唇部轮廓对称度确定网格划分参数并对第一区域、第二区域进行网格划分;
根据第一区域、第二区域对应网格的唇部轮相似度生成第一矩阵;
根据第一视频帧、第二视频帧对应第一矩阵的元素差异生成差异矩阵,根据差异矩阵对第一视频帧、第二视频帧分别赋值生成第一遮罩图像、第二遮罩图像;
利用第一遮罩图像对第一视频帧进行遮罩处理,得到第一唇部运动感知图像,利用第二遮罩图像对第二视频帧进行遮罩处理,得到第二唇部运动感知图像;
将第一、第二唇部运动感知图像输入唇部运动分析模型,得到唇部是否运动的输出,根据输出的变化选择待压缩视频帧。
优选地,根据第一区域、第二区域中对称唇部轮廓像素的坐标差异之和得到唇部轮廓对称度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海洋科学与技术国家实验室发展中心,未经青岛海洋科学与技术国家实验室发展中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110647975.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合结构超导谐振加速腔
- 下一篇:一种通话处理方法、装置及终端设备