[发明专利]网络组图聚合方法和系统以及图片搜索方法和系统无效

专利信息
申请号: 201210302660.6 申请日: 2012-08-23
公开(公告)号: CN103631799A 公开(公告)日: 2014-03-12
发明(设计)人: 尚海霞;张永华 申请(专利权)人: 深圳市世纪光速信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 何平;曾旻辉
地址: 518057 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络 聚合 方法 系统 以及 图片 搜索
【权利要求书】:

1.一种网络组图聚合方法,包括以下步骤:

获取图片的图片信息,所述图片信息包括图片URL、图片所在网页的网页URL和图片所在网页的标题;

提取图片URL特征和图片所在网页的URL特征;

将图片所在网页的标题进行去噪处理,得到图片标题;

将图片URL特征、图片所在网页的URL特征和图片标题相同的图片聚合为一组。

2.根据权利要求1所述的网络组图聚合方法,其特征在于,所述提取图片URL特征和图片所在网页的URL特征的步骤为:提取图片URL中的预设级目录,并提取图片所在网页的URL中的预设级目录。

3.根据权利要求2所述的网络组图聚合方法,其特征在于,所述将图片所在网页的标题进行去噪处理的步骤包括:

将所述网页的标题切分为文字片段;

统计各文字片段在网站内的出现次数和/或各文字片段在所述网站内的出现比重,所述网站为图片所在网页所属的网站;

删除所述出现次数大于第一阈值和/或所述出现比重大于第二阈值的文字片段;

将剩余的文字片段按照文字片段在所述网页的标题中的顺序组合。

4.根据权利要求3所述的网络组图聚合方法,其特征在于,所述将所述网页的标题切分为文字片段的步骤包括:

将所述网页的标题中包含的双标点符号内的内容切分为一个文字片段;

判断与所述双标点符号外的文字中包含的单标点相邻两侧的文字是否都为数字或字母,若否,则将单标点相邻两侧的文字切分成单独的文字片段。

5.根据权利要求1所述的网络组图聚合方法,其特征在于,所述图片信息还包括图片标识;

所述方法还包括:

删除聚合成的组图中图片标识相同的图片。

6.一种网络组图聚合系统,其特征在于,包括:

图片信息获取模块,用于获取图片的图片信息,所述图片信息包括图片URL、图片所在网页的网页URL和图片所在网页的标题;

特征提取模块,用于提取图片URL特征和提取图片所在网页的URL特征;

标题去噪模块,用于将图片所在网页的标题进行去噪处理,得到图片标题;

组图聚合模块,用于将图片URL特征、图片所在网页的URL特征和图片标题相同的图片聚合为一组。

7.根据权利要求6所述的网络组图聚合系统,其特征在于,所述特征提取模块用于提取图片URL中的预设级目录,并

提取图片所在网页的URL中的预设级目录。

8.根据权利要求7所述的网络组图聚合系统,其特征在于,所述标题去噪模块包括:

切分模块,用于将所述网页的标题切分为文字片段;

统计模块,用于统计各文字片段在网站内的出现次数和/或各文字片段在所述网站内的出现比重,所述网站为图片所在网页所属的网站;

组合模块,用于删除所述出现次数大于第一阈值和/或所述出现比重大于第二阈值的文字片段,将剩余的文字片段按照文字片段在所述网页的标题中的顺序组合。

9.根据权利要求8所述的网络组图聚合系统,其特征在于,所述切分模块用于将所述网页的标题中包含的双标点符号内的内容切分为一个文字片段;判断与所述双标点符号外的文字中包含的单标点相邻两侧的文字是否都为数字或字母,若否,则将单标点相邻两侧的文字切分成单独的文字片段。

10.根据权利要求6所述的网络组图聚合系统,其特征在于,所述图片信息还包括图片标识;

所述系统还包括:

去重模块,用于删除聚合成的组图中图片标识相同的图片。

11.一种图片搜索方法,包括以下步骤:

获取输入的图片搜索关键字;

获取与所述搜索关键字匹配的组图,所述组图为按照权利要求1至5任一所述的方法聚合而成的组图;

输出所述匹配的组图。

12.根据权利要求11所述的图片搜索方法,其特征在于,所述获取与所述搜索关键字匹配的组图的步骤为:

获取组图标题与所述搜索关键字匹配的组图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210302660.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top