[发明专利]网络组图聚合方法和系统以及图片搜索方法和系统无效
申请号: | 201210302660.6 | 申请日: | 2012-08-23 |
公开(公告)号: | CN103631799A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 尚海霞;张永华 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;曾旻辉 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 聚合 方法 系统 以及 图片 搜索 | ||
1.一种网络组图聚合方法,包括以下步骤:
获取图片的图片信息,所述图片信息包括图片URL、图片所在网页的网页URL和图片所在网页的标题;
提取图片URL特征和图片所在网页的URL特征;
将图片所在网页的标题进行去噪处理,得到图片标题;
将图片URL特征、图片所在网页的URL特征和图片标题相同的图片聚合为一组。
2.根据权利要求1所述的网络组图聚合方法,其特征在于,所述提取图片URL特征和图片所在网页的URL特征的步骤为:提取图片URL中的预设级目录,并提取图片所在网页的URL中的预设级目录。
3.根据权利要求2所述的网络组图聚合方法,其特征在于,所述将图片所在网页的标题进行去噪处理的步骤包括:
将所述网页的标题切分为文字片段;
统计各文字片段在网站内的出现次数和/或各文字片段在所述网站内的出现比重,所述网站为图片所在网页所属的网站;
删除所述出现次数大于第一阈值和/或所述出现比重大于第二阈值的文字片段;
将剩余的文字片段按照文字片段在所述网页的标题中的顺序组合。
4.根据权利要求3所述的网络组图聚合方法,其特征在于,所述将所述网页的标题切分为文字片段的步骤包括:
将所述网页的标题中包含的双标点符号内的内容切分为一个文字片段;
判断与所述双标点符号外的文字中包含的单标点相邻两侧的文字是否都为数字或字母,若否,则将单标点相邻两侧的文字切分成单独的文字片段。
5.根据权利要求1所述的网络组图聚合方法,其特征在于,所述图片信息还包括图片标识;
所述方法还包括:
删除聚合成的组图中图片标识相同的图片。
6.一种网络组图聚合系统,其特征在于,包括:
图片信息获取模块,用于获取图片的图片信息,所述图片信息包括图片URL、图片所在网页的网页URL和图片所在网页的标题;
特征提取模块,用于提取图片URL特征和提取图片所在网页的URL特征;
标题去噪模块,用于将图片所在网页的标题进行去噪处理,得到图片标题;
组图聚合模块,用于将图片URL特征、图片所在网页的URL特征和图片标题相同的图片聚合为一组。
7.根据权利要求6所述的网络组图聚合系统,其特征在于,所述特征提取模块用于提取图片URL中的预设级目录,并
提取图片所在网页的URL中的预设级目录。
8.根据权利要求7所述的网络组图聚合系统,其特征在于,所述标题去噪模块包括:
切分模块,用于将所述网页的标题切分为文字片段;
统计模块,用于统计各文字片段在网站内的出现次数和/或各文字片段在所述网站内的出现比重,所述网站为图片所在网页所属的网站;
组合模块,用于删除所述出现次数大于第一阈值和/或所述出现比重大于第二阈值的文字片段,将剩余的文字片段按照文字片段在所述网页的标题中的顺序组合。
9.根据权利要求8所述的网络组图聚合系统,其特征在于,所述切分模块用于将所述网页的标题中包含的双标点符号内的内容切分为一个文字片段;判断与所述双标点符号外的文字中包含的单标点相邻两侧的文字是否都为数字或字母,若否,则将单标点相邻两侧的文字切分成单独的文字片段。
10.根据权利要求6所述的网络组图聚合系统,其特征在于,所述图片信息还包括图片标识;
所述系统还包括:
去重模块,用于删除聚合成的组图中图片标识相同的图片。
11.一种图片搜索方法,包括以下步骤:
获取输入的图片搜索关键字;
获取与所述搜索关键字匹配的组图,所述组图为按照权利要求1至5任一所述的方法聚合而成的组图;
输出所述匹配的组图。
12.根据权利要求11所述的图片搜索方法,其特征在于,所述获取与所述搜索关键字匹配的组图的步骤为:
获取组图标题与所述搜索关键字匹配的组图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210302660.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新型节能加热装置
- 下一篇:智能雨刮器及其工作方法