[发明专利]一种利用AI人脸检测提升编码质量的方法在审
| 申请号: | 201911061056.7 | 申请日: | 2019-11-01 |
| 公开(公告)号: | CN110769252A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 曹俊;吴长丽;沈雪峰;符均 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | H04N19/167 | 分类号: | H04N19/167;H04N19/42;H04N7/14;G06K9/00 |
| 代理公司: | 61200 西安通大专利代理有限责任公司 | 代理人: | 高博 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 人脸检测 人脸 视频 预处理 感兴趣区域编码 感兴趣区域 视觉感知 质量提升 编码器 检测 画质 码流 受限 送入 | ||
1.一种利用AI人脸检测提升编码质量的方法,其特征在于,对视频进行预处理,然后采用AI人脸检测对视频中的人脸进行检测,然后得到感兴趣区域送入编码器,完成感兴趣区域编码质量提升。
2.根据权利要求1所述的方法,其特征在于,包括以下步骤:
S1、将欲编码视频帧按比例N做长宽等比例缩小;
S2、缩小后的图片送入AI人脸检测模块;
S3、将AI人脸检测模块中输出标注的人脸的矩形框转坐标转换成感兴趣区域的矩形框坐标;
S4、将步骤S3获得的感兴趣区域送入编码器,设置编码器提升感兴趣区域的编码质量。
3.根据权利要求2所述的方法,其特征在于,步骤S1中,根据画面尺寸及需要检测的最小人脸尺寸的个数M计算N为:
N=W/16M
其中,W为画面宽度,当N为非整数时,N取整。
4.根据权利要求2所述的方法,其特征在于,步骤S3中,AI人脸检测模块输出的人脸矩形标注框为(x,y,w,h),表示矩形框左上角坐标及框大小;编码器的感兴趣区域矩形区域用左上角及右下角坐标(x1,y1,x2y2)标注,x1=Nx,y1=Ny,x2=N*(x+w),y2=N*(y+h)。
5.根据权利要求4所述的方法,其特征在于,针对2个人脸区域,(x1,y1,w1,h1)(x2,y2,w2,h2)表示AI人脸检测输出的2个矩形框,(x11,y11,x12,y12)(x21,y21,x22,y22)表示转换成感兴趣区域的2个矩形区域。
6.根据权利要求2所述的方法,其特征在于,步骤S4中,编码器的格式包括H.264,H.265,VP8,VP9,AVS,AVS+,AVS2和AV1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911061056.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频解码装置、视频编码装置和传输比特流的方法
- 下一篇:影像压缩电路及方法





