[发明专利]一种基于深度卷积神经网络的图像美学质量评价方法在审
申请号: | 201710939293.3 | 申请日: | 2017-10-11 |
公开(公告)号: | CN107610123A | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 金鑫;吴乐;陈思宇;田朝辉;李晓东;赵耿;池经营 | 申请(专利权)人: | 中共中央办公厅电子科技学院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司11251 | 代理人: | 安丽 |
地址: | 100070*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 神经网络 图像 美学 质量 评价 方法 | ||
技术领域
本发明属于图像分析、计算机视觉领域,特别是图像美学质量评价,具体地说是基于深度卷积神经网络的图像美学质量评价方法。
背景技术
随着照相机、摄像机、深度摄像机、智能手机快速普及,图像、视频、3D等可视内容数据与日俱增,可视内容感知理解已经成为可视计算、计算机视觉、计算摄像学等科学研究领域及其交叉方向国际前沿的研究方向。其中图像美学质量评价(Image Aesthetic Quality Assessment)是近期可视内容感知理解方向中的研究热点。
图像美学质量评价(Image Aesthetic Quality Assessment)旨在利用计算机模拟人类对美的感知与理解,自动评价图像的“美感”,即图像美学质量的客观化评价,主要针对拍摄或绘画的图像在构图、颜色、光影、景深、虚实等美学因素方面的效果形成的美感刺激。
随着国家大力推动社会主义文化建设,提高国家文化软实力,发挥文化引领风尚、教育人民、服务社会、推动发展,人们对美的追求和要求也越来越高。审美是人类与生俱来的智能活动和需求,相对于“教会”计算机识别物体、场景、事件等确定性识别类基本技能,如何让计算机也能感知“美”,进而能够自动发现“美”和生成“美”是人工智能、可视计算、计算机视觉、计算摄像学、计算美学、心理学等交叉研究方向的新挑战。
传统的图像质量评价旨在利用计算机模拟人类视觉系统自动评价图像的失真程度,主要是针对图像在采集、压缩、处理、传输及显示等过程中产生图像质量下降情况,通常包括成像条件差而引起的失真、有损压缩引起的失真、噪声、图像传输过程中受信道衰减影响引起的失真等。虽然目的都是获得与主观评价结果相一致的客观评价值,但图像美学质量评价旨在利用计算机模拟人类对美的感知与理解,让这种美感思维体现在计算机中,使计算机能够分别出高质量图像或者低质量图像。
发明内容
本发明的技术解决问题:克服现有技术中大部分只关注单纯的好坏分类以及简单分数,很少预测图片的打分分布,提供一种基于深度卷积神经网络的图像美学质量评价方法,卷积神经网络以其局部权值共享的特殊结构在图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,从而能够有效的模拟出人类对美学的感知。
本发明采用的技术方案为:一种基于深度卷积神经网络的图像美学质量评价方法,构建符合人类对美学的感知表示模型,利用机器学习的方法自动完成对图像的美学质量评价,其特征在于实现步骤:
(1)图像美学质量评价有一个专门的数据集,是从www.dpchallenge.com网站获取到编号靠前的25万张照片,其中每张照片都有一个人工评分结果,范围在1分到10分之间,把其中23万张照片当做训练集,随机抽取2万张照片当做测试集;
(2)对于训练集和测试集中的样本图像进行预处理,首先根据人工评分的结果,如果分数大于5分,则就把这张图像标记为高质量图像,反之,则标记为低质量图像。另外我们还要对原始图像进行大小变换和图像归一化,得到一个图像像素大小都一致的,有回归标签的训练集和测试集;
(3)根据图像的特征分布以及人对图像美学质量评价的标准,设计一个深度卷积神经网络模型,首先利用训练集中的样本图像进行学习训练,通过机器学习方法训练好这个卷积网络模型,实验证明这个模型能够有效的获取图像特征并且能模拟对图像进行打分;
(4)模型的测试和预测,首先对测试集中的样本图像调用步骤(2)获取的预处理后的图像,然后调用步骤(3)中得到的图像美学质量评价模型,通过模型输出的直方图分布数值,和人工评分的直方图结果进行对比测试检验模型准确率,同样可以对图像进行美学质量评价预测。
其中,步骤(1)所述数据集采集方法采取以下步骤:
(11)从www.dpchallenge.com网站获取到编号靠前的25万张照片,并且记录每张照片的得分分布;
(12)将25万张照片按照编号大小的23万张当做训练集,随机抽取2万张当做测试集。
其中,步骤(2)所述图像预处理方法采取以下步骤:
(21)将训练集和测试集中的样本图像根据评论人数和分值的投票数,计算出每张图片的直方图分布;
(22)将训练集中原始图像进行大小变换,将原始图像的像素大小变换到一个固定尺寸,这个尺寸和设计的深度卷积神经网络所要求的输入大小一致;
(23)将训练集中原始图像归一化,首先统计出训练集中的样本图像的均值,然后对每一个样本图像做去均值操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中共中央办公厅电子科技学院,未经中共中央办公厅电子科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710939293.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像处理方法及终端、存储介质
- 下一篇:一种炉口图像预处理方法