[发明专利]获取网页关键字的方法及其应用系统有效
申请号: | 200610112462.8 | 申请日: | 2006-08-18 |
公开(公告)号: | CN1909522A | 公开(公告)日: | 2007-02-07 |
发明(设计)人: | 田野;陈亮;李晶 | 申请(专利权)人: | 北京金山软件有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 100083北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种获取网页关键字的方法及其应用系统,所述方法通过对网页标题进行分词,获取网页标题词根,根据各网页标题词根在网页中出现的次数,选择出现次数多的至少一个网页标题词根作为所述网页的关键字。采用该方法可以实现快速、准确的获取网页关键字,并且该方法适用于各种类型的网站,比如,网页数量非常庞大的综合性网站或网页信息由用户发布的论坛等网站。将本发明提供的获取关键字的方法应用于网页爬抓系统,对爬抓到的网页进行分析,获取爬抓网页关键字,并将所述爬抓网页及其关键字存入数据库,根据用户需要为其提供更多可供查询的网页。 | ||
搜索关键词: | 获取 网页 关键字 方法 及其 应用 系统 | ||
【主权项】:
1、一种获取网页关键字的方法,其特征在于,该方法包括:获取网页标题,对网页标题进行分词,得到网页标题词根;在网页中搜索网页标题词根,统计网页标题词根在网页中出现的次数;选择在网页中出现次数多的至少一个网页标题词根作为所述网页关键字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山软件有限公司,未经北京金山软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610112462.8/,转载请声明来源钻瓜专利网。
- 上一篇:用于磁共振仪的真空罩
- 下一篇:碱性电池外壳用薄膜以及使用该薄膜的薄空气电池