[发明专利]基于超链接的主题预测算法在审

专利信息
申请号: 201611023682.3 申请日: 2016-11-22
公开(公告)号: CN106776722A 公开(公告)日: 2017-05-31
发明(设计)人: 贾海龙 申请(专利权)人: 新乡学院
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京科亿知识产权代理事务所(普通合伙)11350 代理人: 汤东凤
地址: 陕西省西安*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 超链接 主题 预测 算法
【权利要求书】:

1.一种基于超链接的主题预测算法,其特征在于:首先假设有网页集合S={1,2,…,N},在此基础上做如下定义:

矩阵H:网页之间链接图对应的链接矩阵;

yn:网页n(n∈S)的内容权值(Authority)

Zn:网页n(n∈S)的链接权值(Hub);

y=(y1,...,yN)T:内容权值向量;

z=(z1,...,zN)T:链接权值向量;

An:所有指向网页n的集合;

Bn:所有被网页n指向的网页集合;

具体算法步骤:

(1)初始化内容权值向量y,使初始化链接权值向量z,使

(2)进行第k步迭代的时候,网页n的内容权值yn由所有指向它的网页集An的Hub值组成,即其矩阵表达式为y=HTz;

(3)在步骤(2)中得到新的内容权值向量y后,网页n的Hub值Zn由它所引用的网页Bn的内容权值组成,即其矩阵表达式为z=Hy;

(4)对步骤(2)和(3)中计算的向量y和z进行单位化,使得

按照以上四个步骤进行循环迭代,直到收敛结束;

为了更深层次的分析HITS算法,将第k步迭代得到的内容向量和链接向量分别记作yk和zk,其中:

<mrow><msup><mi>y</mi><mi>k</mi></msup><mo>=</mo><msup><mrow><mo>(</mo><msubsup><mi>y</mi><mn>1</mn><mi>k</mi></msubsup><mo>,</mo><msubsup><mi>y</mi><mn>2</mn><mi>k</mi></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>y</mi><mi>N</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>

<mrow><msup><mi>Z</mi><mi>k</mi></msup><mo>=</mo><msup><mrow><mo>(</mo><msubsup><mi>z</mi><mn>1</mn><mi>k</mi></msubsup><mo>,</mo><msubsup><mi>z</mi><mn>2</mn><mi>k</mi></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>z</mi><mi>N</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>

初始化为:

<mrow><msup><mi>y</mi><mn>0</mn></msup><mo>=</mo><msup><mrow><mo>(</mo><mn>1</mn><mo>/</mo><msqrt><mrow><mi>N</mi><mo>,</mo></mrow></msqrt><mn>1</mn><mo>/</mo><msqrt><mrow><mi>N</mi><mo>,</mo></mrow></msqrt><mo>...</mo><mo>,</mo><mn>1</mn><mo>/</mo><msqrt><mrow><mi>N</mi><mo>,</mo></mrow></msqrt><mo>)</mo></mrow><mi>T</mi></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>

<mrow><msup><mi>z</mi><mn>0</mn></msup><mo>=</mo><msup><mrow><mo>(</mo><mn>1</mn><mo>/</mo><msqrt><mrow><mi>N</mi><mo>,</mo></mrow></msqrt><mn>1</mn><mo>/</mo><msqrt><mrow><mi>N</mi><mo>,</mo></mrow></msqrt><mo>...</mo><mo>,</mo><mn>1</mn><mo>/</mo><msqrt><mrow><mi>N</mi><mo>,</mo></mrow></msqrt><mo>)</mo></mrow><mi>T</mi></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>

根据算法步骤(2)、(3)和(4),可以计算:

yk=φkψkHTHyk-1,k=2,3,.... (5)

zk=ψkφkHHTzk-1,k=1,2,.... (6)

收敛后,得到内容向量和链接向量分别为:

<mrow><msup><mi>y</mi><mo>,</mo></msup><mo>=</mo><mfrac><mn>1</mn><msup><mi>&lambda;</mi><mo>,</mo></msup></mfrac><msup><mi>H</mi><mi>T</mi></msup><msup><mi>Hy</mi><mo>,</mo></msup><mo>,</mo><msup><mi>z</mi><mo>,</mo></msup><mo>=</mo><mfrac><mn>1</mn><msup><mi>&lambda;</mi><mo>,</mo></msup></mfrac><msup><mi>HH</mi><mi>T</mi></msup><msup><mi>z</mi><mo>,</mo></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>

在式(7)中,内容向量y'是矩阵HTH的一个特征向量,链接向量z'是矩阵HHT的一个特征向量,因此为了确定内容向量和链接向量的存在和唯一性,下文对式中HTH和HHT进行分析。因为内容向量对应矩阵HTH,链接向量对应HHT,所以下文将HTH称作内容矩阵,将HHT称作链接矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新乡学院,未经新乡学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611023682.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top