[发明专利]特征量化方法和装置、编码器、通信系统有效
申请号: | 202111037377.0 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113747155B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 王立传;王慧芬;王泽琨;王翰铭;贺征 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/136;H04N19/184;H04N19/42;H04N19/182 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘剑波 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 量化 方法 装置 编码器 通信 系统 | ||
本公开提供一种特征量化方法和装置、编码器、通信系统。特征量化方法包括:从特征提取网络模型获取第一浮点特征,其中特征提取网络模型从输入图像中提取出第一浮点特征;将第一浮点特征进行特征量化处理,以得到具有预设比特长度的第二特征;将第二特征发送给编码装置,以便编码装置对第二特征进行编码以得到比特流。
技术领域
本公开涉及编码领域,特别涉及一种特征量化方法和装置、编码器、通信系统。
背景技术
传统的视频压缩编码面向人类视觉,多用于娱乐用途,注重信号保真度、高帧率等,无法匹配面向智能分析任务的机器视觉对于高准确性、低延迟和抽象语义的应用需求。面向人类视觉和面向机器视觉的视频压缩编码在应用场景、评估机制、信息处理和信息使用上存在较大差异。2019年7月,瑞典哥德堡第128次MPEG会议期间成立了VCM(VideoCoding for Machines,机器视觉编码)标准组,旨在研究适合机器视觉和人机混合视觉场景以智能应用为目标的压缩编码技术。
例如,典型应用场景为:利用特征抽取网络提取输入图像的特征后,需要对特征进行压缩/解压缩处理,并将处理后的特征输入任务网络进行处理,以得到输出结果。
发明内容
发明人注意到,在相关技术中,为了降低特征数据的传输量,需要对特征抽取网络所抽取的特征进行压缩/解压缩,但该操作容易导致后续任务网络的性能损失。
为此,本公开提供一种特征量化方案,能够有效减小性能损失。
根据本公开实施例的第一方面,提供一种特征量化方法,由特征量化装置执行,包括:从特征提取网络模型获取第一浮点特征,其中特征提取网络模型从输入图像中提取出第一浮点特征;将第一浮点特征进行特征量化处理,以得到具有预设比特长度的第二特征;将第二特征发送给编码装置,以便编码装置对第二特征进行编码以得到比特流。
在一些实施例中,将第一浮点特征进行特征量化处理包括:将第一浮点特征转换为整形特征BM;根据整形特征BM计算对应的直方图H,其中Hi是整形特征BM的第i个通道BM,i的直方图,i为通道号,1≤i≤c, c为通道总数;根据直方图H倒求累计直方图P,其中Pi,j=Pi,i+1+Hi,j, Hi,j是直方图H的第i个通道中的第j个子项,Pi,j是累计直方图P的第i 个通道中的第j个子项;根据累计直方图P进行截断处理,其中若Pi,j大于预设门限,则更新第一浮点特征在第i个通道中的最大值fmax,i;根据预设参数和第一浮点特征在第i个通道中的最大值fmax,i对第一浮点特征在第i个通道中的特征值F32_1,i进行量化处理,以得到第二特征。
在一些实施例中,利用公式
将第一浮点特征F32_1转换为整形特征BM,其中A为预设参数,int 为整形转换函数,round为四舍五入函数,fmax_1为第一浮点特征的最大值。
在一些实施例中,利用公式
更新第一浮点特征在第i个通道中的最大值fmax,i,其中B为预设参数,float为浮点数转换函数。
在一些实施例中,利用公式
计算第二特征在第i个通道中的特征值F8_1,i,其中C为预设参数, max为取最大值函数,F32_1,i为第一浮点特征在第i个通道中的特征值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111037377.0/2.html,转载请声明来源钻瓜专利网。