[发明专利]一种关键页面的确定方法及装置有效
申请号: | 201510947063.2 | 申请日: | 2015-12-16 |
公开(公告)号: | CN105608133B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 张龙;郭洋洋;李丹 | 申请(专利权)人: | 北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/958 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键 页面 确定 方法 装置 | ||
本发明公开了一种关键页面的确定方法及装置,可针对任一站点,获取该站点中的所有有效链接以及所有有效链接之间的父子关系;以及,针对每一有效链接,根据得到的父子关系,确定所述有效链接的关键度相关参数,并根据各关键度相关参数以及其所对应的权重,计算所述有效链接的关键度;最后,将确定的至少一个关键度不小于设定阈值的有效链接所分别对应的页面作为该站点的关键页面。即,通过设置与链接的重要性相关的参数以及各参数所对应的权重,为关键页面的确定提供直接的量化指标,从而可自动、定量地计算站点中各页面的关键度,使得关键页面的确定以及选取更加准确、灵活,并减少了手动配置关键页面等的工作量,提高了确定关键页面的效率。
技术领域
本发明涉及互联网领域,尤其涉及一种关键页面的确定方法及装置。
背景技术
对于一个站点而言,根据页面类型和等级可以将该站点中的所有页面分为:关键页面、过程页面和结果页面。通常,主页、导航页是一个站点的关键页面,而串联这些关键页面之间的页面,如注册、注册引导页面,就是过程页面,结果页面则是用户行为的结束页面,如注册成功、订阅成功、域名过期、及搜索结果不存在页面等。
一个站点的关键页面对于该站点而言,不但拥有最高的曝光度,而且是搜索引擎导入流量的入口。因而,对于监控、扫描服务等业务,就需要重点关注站点的关键页面的访问响应速度、是否被篡改、有无挂马等情况。因而,如何获取一个站点的关键页面,就成为这些服务的实施基础。
目前,一般基于用户手动配置来确定站点的关键页面;或者根据页面内的链接数确定关键页面,如,链接数较多的就是关键页面等。但是,由于用户手动配置关键页面需要人工参与,准确性虽然较高,但存在灵活度较差的问题,使得用户体验度并不佳;而根据页面内链接数的多少确定关键页面容易出现误判,例如,一个罗列了很多下载链接或友情链接的无关紧要的页面,很容易被误判为关键页面。
因此,亟需一种新的确定站点关键页面的方法,来解决现有的关键页面确定方式所存在的灵活性低,容易出现误判的问题。
发明内容
本发明实施例提供了一种关键页面的确定方法及装置,用以解决现有的确定关键页面的方式所存在的灵活性低,容易出现误判的问题。
本发明实施例提供了一种关键页面的确定方法,所述方法包括:
针对任一站点,获取所述站点中的所有有效链接以及所述所有有效链接之间的父子关系;
针对获取到的每一有效链接,根据获取到的所述所有有效链接之间的父子关系,确定所述有效链接的各用于表征所述有效链接的重要度的关键度相关参数,并根据确定的各关键度相关参数以及各关键度相关参数所对应的权重,采用加权求和的方式,计算所述有效链接的关键度;
根据计算得到的各有效链接的关键度,确定所述站点中的对应的关键度不小于设定阈值的至少一个有效链接,并将确定的至少一个有效链接所分别对应的页面作为所述站点的关键页面。
可选地,针对任一有效链接,所述有效链接的关键度相关参数包括:链接密度、链接深度、连通系数以及平均布局系数;则,针对获取到的每一有效链接,根据获取到的所述所有有效链接之间的父子关系,确定所述有效链接的各用于表征所述有效链接的重要度的关键度相关参数,并根据确定的各关键度相关参数以及各关键度相关参数所对应的权重,采用加权求和的方式,计算所述有效链接的关键度,包括:
针对获取到的每一有效链接,根据获取到的所述所有有效链接之间的父子关系,确定所述有效链接的链接密度、链接深度、连通系数以及平均布局系数,并根据确定的所述有效链接的链接密度、链接深度、连通系数、平均布局系数,以及所述有效链接的链接密度、链接深度、连通系数、平均布局系数所分别对应的权重,采用加权求和的方式,计算所述有效链接的关键度。
可选地,针对任一有效链接,通过以下公式确定所述任一有效链接的链接密度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司,未经北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510947063.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种标签提取方法及装置
- 下一篇:截屏方法及装置