[发明专利]为网页分配关键词有效

专利信息
申请号: 201080034039.5 申请日: 2010-07-20
公开(公告)号: CN102473190A 公开(公告)日: 2012-05-23
发明(设计)人: 穆拉里达兰·萨姆帕思·柯迪阿兰姆;沙立·慕克吉;王利民;尹星焕 申请(专利权)人: 阿尔卡特朗讯
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人: 罗朋
地址: 法国*** 国省代码: 法国;FR
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网页 分配 关键词
【权利要求书】:

1.一种为网页分配关键词的方法,包括:

识别与所述网页相关的自有关键词,所述自有关键词包括从所述网页中获得的关键词数据;

识别与所述网页相关的内链关键词,所述内链关键词包括从包含链接至所述网页的链接的其他网页中获得的关键词数据;

识别与所述网页相关的外链关键词,所述外链关键词包括从包含所述网页链接至其他网页的链接的所述其他网页中获得的关键词数据;以及

合并所述自有、内链和外链关键词,以为所述网页形成关键词集合。

2.权利要求1的所述方法,还包括:

处理所述自有、内链和外链关键词集合,以提供所述自有、内链和外链关键词相应的有序排序集合。

3.权利要求2的所述方法,还包括:

利用一个或多个启发式函数,确定所述自有、内链和外链关键词集合中每个关键词的相对重要度。

4.权利要求2的所述方法,还包括:

为所述自有、内链及外链关键词分配权重;

其中,所述合并步骤包括根据所述关键词权重来合并所述自有、内链及外链关键词。

5.权利要求1的所述方法,其中,被识别的关键词数据包括来自标题字段、元关键词字段和元描述字段之一个或多个的数据。

6.权利要求1的所述方法,还包括:

将任何在自有、内链、及外链关键词列表中出现的,由第一分隔标识分隔的一个或多个词,识别为潜在独特关键词;

将代表有效短语的所述潜在独特关键词包含至为所述网页设置的所述关键词集合中,其中,拼写引擎、语法引擎和搜索引擎中的任一个被用于确定一个潜在独特关键词是否代表有效短语。

7.权利要求1的所述方法,还包括:

将任何在所述自有、内链、及外链关键词列表中出现的N个相邻的被空格分隔的词,识别为潜在独特关键词,其中,N是一个大于一的整数;以及

将代表有效短语的所述潜在独特关键词包含至为所述网页设置的所述关键词集合中。

8.权利要求3的所述方法,其中,所述内链和外链关键词中的每个根据相应源网页的排名来被分配权重,所述源网页排名采用搜索引擎来被确定。

9.权利要求1的所述方法,其中,所述内链关键词网页通过采用网页爬虫和搜索引擎中的一个或多个来被识别。

10.设备,包括用于存储软件指令的存储器和用于执行所述软件指令的处理器,其中,所述软件指令,当被所述处理器执行时,触发所述设备执行为网页分配关键词的方法,所述方法包括:

识别与所述网页相关的自有关键词,所述自有关键词包括从所述网页中获得的关键词数据;

识别与所述网页相关的内链关键词,所述内链关键词包括从包含链接至所述网页的链接的其他网页中获得的关键词数据;

识别与所述网页相关的外链关键词,所述外链关键词包括从包含所述网页链接至其他网页的链接的所述其他网页中获得的关键词数据;

合并所述自有、内链和外链关键词,为所述网页形成关键词集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔卡特朗讯,未经阿尔卡特朗讯许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080034039.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top