[发明专利]处理图片的方法、装置以及搜索图片的方法有效
申请号: | 200810116455.4 | 申请日: | 2008-07-10 |
公开(公告)号: | CN101308508A | 公开(公告)日: | 2008-11-19 |
发明(设计)人: | 贾梦雷;张阔 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 蒋贤起;逯长明 |
地址: | 100084北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 图片 方法 装置 以及 搜索 | ||
技术领域
本发明涉及网络技术领域,特别是涉及处理图片的方法、装置以及搜索 图片的方法。
背景技术
对页面中包含的图片内容进行分析和资料提取,是搜索引擎工作的重要 内容。但是,现有技术中针对单个页面的页面分析技术,由于缺乏关于某个 网站的统计信息,无法有效的去除图片标题中的网站名、论坛名、版面名、 版主名、时间、帖子打分等无效字段,由此带来的负面影响有:
1、出现不相关的结果。这是由于查询词命中了无效字段导致,例如查询 “凤凰”而图片标题含有“凤凰播报”。这个结果不是搜索用户所需要的结果。
2、相关性好结果的排名靠后。由于无效字段数量众多,导致与图片相关 性好的有效信息被淹没在无效字段中,导致计算评分时较低。例如内容为奔 驰轿车的图标题为“奔驰飘香网络>>图片中心>>爱车一族”。
3、给用户展现的字段中出现不相关内容,降低了用户体验。
发明人在实现本发明的过程中,发现现有技术中至少存在如下问题:
针对单个页面分析导致搜索结果相关性差,用户体验度低。
发明内容
有鉴于此,本发明一个或多个实施例的目的在于提供处理图片的方法、 装置以及搜索图片的方法,以实现提高搜索结果的相关性,提升用户体验度。
为解决上述问题,本发明实施例提供了一种处理图片标题的方法,包括:
将所有图片的图片标题以图片所在页面的网站为单位划分;
将所述图片标题依分隔符分割成若干个字段;
统计图片标题中所包含的各个字段在同一网站下的各个图片标题中出现 的次数;
如果所述字段出现的次数达到预置条件,则将所述字段识别为相应网站 中的无效字段;
去除所述相应网站中图片标题中所包含的所述无效字段。
还提供了一种处理图片标题的装置,包括:
网站划分单元,用于将所有图片的图片标题以图片所在页面的网站为单 位划分;
分隔单元,用于将所述图片标题依分隔符分割成若干个字段;
统计单元,用于统计图片标题中所包含的各个字段在同一网站下的各个 图片标题中出现的次数;
识别单元,用于如果所述字段出现的次数达到预置条件,则将所述字段 识别为相应网站中的无效字段;
第一去除单元,用于去除所述相应网站中图片标题中所包含的所述无效 字段。
还提供了一种搜索图片的方法,包括:
将所有图片的图片标题以图片所在页面的网站为单位划分;
将所述图片标题依分隔符分割成若干个字段;
统计图片标题中所包含的各个字段在同一网站下的各个图片标题中出现 的次数;
如果所述字段出现的次数达到预置条件,则将所述字段识别为相应网站 中的无效字段;
去除所述相应网站中图片标题中所包含的所述无效字段;
获取与查询词相关的图片标题;
输出所述图片标题对应的链接。
与现有技术相比,本发明实施例具有以下优点:
首先,排序效果明显改善。
由于通过无效字段的去除,就减少了无效字段有关的结果出现。由于无 效字段代表不相关结果,所以,不相关的结果不会再出现在搜索结果的前列。
与图片相关的有效信息在计算评分时权重更高,有利于真正相关的结果 排在前面,相关性好的结果排名前移。
其次,由于搜索结果相关性好,用户体验度提高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1所示,是本发明的处理图片标题的方法的实施例一的流程图;
图2所示,是本发明的处理图片标题的装置的实施例一的框图;
图3所示,是本发明实施例所提供的搜索引擎的实施例一框图;
图4所示,是本发明的搜索图片的方法的实施例一的流程图;
图5所示,是模块A的处理过程的流程图;
图6所示,是模块B的处理过程的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810116455.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种连续生产多晶硅锭的定向凝固方法及其装置
- 下一篇:用户组织管理系统及方法