[发明专利]推荐系统的多样性的量化方法有效
申请号: | 202110136164.7 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112948238B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 安俊秀;孙琛恺;靳宇倡;陈宏松 | 申请(专利权)人: | 成都信息工程大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06Q10/0639;G06F16/906 |
代理公司: | 北京元本知识产权代理事务所(普通合伙) 11308 | 代理人: | 王红霞 |
地址: | 610225 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 系统 多样性 量化 方法 | ||
1.推荐系统的多样性的量化方法,其特征在于,包括如下步骤:
步骤1、从日志中获取URL及用户信息,并根据分类词提前设定URL种类,将相关信息保存在同一文件中;
步骤2、编写程序将URL进行分类并初次筛选,将可分类且分类项明确的URL保存下来,形成类别—URL—用户的三部图,URL—用户的三部图是将一个独立集合上的点与另一个独立集合的点联系起来,定义为三元组B=(Τ,⊥,E);
步骤3、将所得的三元组中的值导入MySQL数据库中,再从中筛选重复数据,第二次筛选将用户访问URL次数大于2次的筛选出来,再将其根据类别分别导出,得到多个类别的三部图;
步骤4、将三部图思想编入程序中并进行计算,得到Herfindahl多样性指数以及校准的Herfindahl多样性指数,将各类别的校准的多样性指数与其在总类别中所占的比例进行计算,得到推荐系统的多样性指数:
其中,S表示推荐系统的名称,T表示URL的类别的集合,v表示在T集合中的某一个类别,count(v)表示v类别下的URL总数,count(Τ)表示在T集合中的所有类别的URL总数,⊥为用户的集合,u表示在⊥集合中的某一用户节点,chd(v,u)表示类别v的校准的Herfindahl多样性指数的值,chd(S)表示推荐系统的校准的Herfindahl多样性指数的值;
步骤4中Herfindahl多样性指数,将形式上的随机游走用概率分布来表示,即定义T类别和⊥用户中的节点u的Herfindahl指数为:
其中,T为URL类别的集合,⊥为用户的集合,p表示概率,u表示在⊥集合中的某一用户节点,v表示在T集合中的某一个类别,hd(Τ,u)表示用户u在集合T中的Herfindahl指数的值;
步骤4中校准的Herfindahl多样性指数为:
其中,Rand(Τ)表示用户访问URL时,在T集合下的随机访问形成的三部图,T为URL类别的集合,u表示在⊥集合中的某一用户节点,chd(T,u)表示集合T的校准的Herfindahl多样性指数的值,hd(Rand(Τ),u)表示用户u在随机生成的集合Rand(T)中的Herfindahl指数的值,hd(Τ,u)表示用户u在集合T中的Herfindahl指数的值。
2.根据权利要求1所述的推荐系统的多样性的量化方法,其特征在于,定义为三元组B=(Τ,⊥,E),并根据搜狗搜索引擎日志中的信息构造三部图,具体的,将Τ定义为URL类别的集合,⊥定义为用户的集合,是URL类别与用户联系关系的集合;对于每个节点v∈Τ,定义其相邻点集合N(v)={u∈⊥|(v,u)∈E}并且通过类似的方式定义节点u∈⊥,相邻点集合N(u)={v∈Τ|(u,v)∈E};相邻点的集合大小称为度:d(u)=|N(u)|;同样,定义一个二部图来表示URL与类别之间的关系,在此基础上,将两个二部图合并起来为了分析用户活动的完整结构形成一个三部图T=(Τ,X,⊥,E1,E2),其中,Τ是URL的类型的集合,X是URL的集合,⊥是用户的集合,是URL类型与URL关系的集合,是URL与用户关系的集合。
3.根据权利要求2所述的推荐系统的多样性的量化方法,其特征在于,用户及URL的访问次数的权重函数将加权度定义为:通过三部图,分析Τ的双向投影来对类别与用户活动的关系进行分析,将双向投影定义为Pr(Τ)=(Τ,⊥,EPr(Τ)),其中若三部图是加权的,则投影会得出的加权函数将其定义为:
其中,T为URL类别的集合,u表示在⊥集合中的某一用户节点,v表示在T集合中的某一个类别,z表示在X集合中的某一条URL,表示类别v与用户u之间的双向投影的加权函数,表示在关系集合E2上,用户u与URL集合中的某项z的加权函数,N(v)表示v的相邻点集合,N(u)表示u的相邻点集合,
三部图设置完成后,在分析用户与类别的关系时,舍弃常用的距离量化,而依赖三部图中的随机游走,计算不同URL属于类别v的概率分布,定义任意节点v∈Τ,z∈X,定义从z到v的概率为:
其中,Τ是URL的类型的集合,X是URL的集合,v表示在T集合中的某一个类别,z表示在X集合中的某一条URL,w(z,v)表示URL集合中的节点z到类别v的加权函数,dw(z)表示URL集合中的节点z的加权度,
同理,对任意节点z∈X,u∈⊥,定义从u到z概率为:
其中,X是URL的集合,⊥是用户的集合u表示在⊥集合中的某一用户节点,z表示在X集合中的某一条URL,w(u,z)表示用户u到URL集合中的节点z的加权函数,dw(u)表示用户集合中的节点u的加权度,
得到从u到v的概率是:
其中,Τ是URL的类型的集合,X是URL的集合,⊥是用户的集合,u表示在⊥集合中的某一用户节点,z表示在X集合中的某一条URL,v表示在T集合中的某一个类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110136164.7/1.html,转载请声明来源钻瓜专利网。