[发明专利]对包括文字内容和图像内容的图片识别在审
申请号: | 201710823997.4 | 申请日: | 2017-09-13 |
公开(公告)号: | CN107832765A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 邓玥琳;高光明;刘辉;丁飞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06F17/27 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙)11370 | 代理人: | 罗朋 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 文字 内容 图像 图片 识别 | ||
技术领域
本发明涉及图片识别技术领域,具体涉及一种对包括文字内容和图像内容的图片进行语义识别的技术。
背景技术
目前的图片识别技术对于内容比较单一的图片的准确率较高,从而自动审核完成较好。例如,对于内容要么为文字、商标,要么为单一主题的图片,图片审核系统可以直接通过OCR技术来识别图片中的文字或商标,或者通过基于深度学习的图像分类技术对图片中的元素进行识别,以判断其是否符合发布标准。
然而,对于同时包括文字内容和图像内容的图片,现有的图片识别技术较难适用,多通过人工审核进行,这使得审核人员的压力较大,且审核周期也较长。
发明内容
本发明的目的是提供一种图片识别方法、装置以及计算机设备、计算机可读存储介质与计算机程序产品。
根据本发明的一个方面,提供了一种图片识别方法,其中,该方法包括以下步骤:
-定位图片中的文字区域和图像区域;
-对所述文字区域中的文字内容提取相应的词向量;
-对所述图像区域提取图像特征向量;
-将所述词向量与所述图像特征向量进行整合,以确定所述图片的语义。
根据本发明的一个方面,还提供了一种图片识别装置,其中,该装置包括:
用于定位图片中的文字区域和图像区域的装置;
用于对所述文字区域中的文字内容提取相应的词向量的装置;
用于对所述图像区域提取图像特征向量的装置;
用于将所述词向量与所述图像特征向量进行整合,以确定所述图片的语义的装置。
根据本发明的一个方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现根据本发明的一个方面的一种图片识别方法。
根据本发明的一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现根据本发明的一个方面的一种图片识别方法。
根据本发明的一个方面,还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时实现根据本发明的一个方面的一种图片识别方法。
与现有技术相比,本发明提供了一种由计算机设备自动对图片进行识别的方案,从而对包括文字内容和图像内容的图片在发布前进行内容识别和审核。具体地,本发明通过对包括文字内容和图像内容的图片进行更细粒度的分割,准确定位其中的文字区域和图像区域,进而对各区域所提取的词向量和图像特征向量进行整合,以识别图片的语义。在识别出图片的语义之后,本发明还可以进一步判断其是否符合发布标准,以进行发布审核,例如判断待发布的图片是否具有低俗内容,当具有低俗内容时,则不符合发布标准,属于高风险图片。
本发明可以有效应用于广告的发布审核。对于包括文字内容和图像内容的广告图片,本发明的图片识别系统可以对其进行识别和发布风险识别,以加快广告图片的发布速度,同时保证高风险图片被识别和过滤而不会被不当发布,这也提升了广告发布用户和网络用户的体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图;
图2示出根据本发明一个实施例的一种对包括文字内容和图像内容的图片进行识别的方法流程图;
图3示出根据本发明一个示例的包括文字内容和图像内容的图片的示意图;
图4示出根据本发明一个实施例的一种对包括文字内容和图像内容的图片进行识别的装置的示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710823997.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序