[发明专利]一种基于文献信息共性模式的推荐方法有效
| 申请号: | 201710472900.X | 申请日: | 2017-06-21 |
| 公开(公告)号: | CN107341199B | 公开(公告)日: | 2020-05-22 |
| 发明(设计)人: | 曹佳;王思檬;齐雯 | 申请(专利权)人: | 北京林业大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/335 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;顾炜 |
| 地址: | 100083 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提出了一种基于文献信息共性模式的推荐方法,该方法能向用户推荐其感兴趣的科技文献。具体实现包括:根据文献的关键词信息,运用基于聚类机制的模式识别算法获取每篇文献的关键词模式;基于用户正在访问的文献,通过该文献的关键词模式,向用户推荐具有共性模式的其他文献。该方法是一种基于文献关键词共性模式的推荐方法,无需用户的历史行为数据即可向用户推荐其感兴趣的文献,提高了推荐结果的多样性。 | ||
| 搜索关键词: | 一种 基于 文献 信息 共性 模式 推荐 方法 | ||
【主权项】:
一种基于文献信息共性模式的推荐方法,其特征在于,包括如下步骤:步骤1、收集并整理科技文献,首先提取文献信息,并将这些信息存储在文献数据表D中,该表D的字段包括D_ID,即文献编号,每个文献具有唯一编号;Title,即文献标题;Keywords,即关键词集,其中关键词之间以”,”作为分隔符;Paper_mode用于记录文献的模式,该字段将通过本方法后续计算所得。D表的每一行表示一篇文献的文献信息;步骤2、识别文献信息的共性模式,过程如下:步骤2.1、构建关键词表K,该表K每一行对应一个关键词及其所在文献的集合等信息,该表的字段包括:K_ID,即关键词编号,每个关键词具有唯一编号;K_word,即关键词;K_papers,即文献ID集合,本字段记录每个关键词对应的文献ID集合其中每个编号以“,”作为分隔符;Cluster,用于记录关键词所属类别,该字段将通过本方法后续计算所得;步骤2.2、统计关键词和文献之间的关系信息,具体过程如下:扫描表D,将其中无重复的关键词分别存入表K的K_word字段,并且将该关键词所在的文献编号,即表D中D_ID字段存入K_papers中,其中编号以“,”分隔,同时统计所在的文献总数,最后按照每个关键词的文献总数对表K中的关键词进行降序排序;步骤2.3、计算每个关键词的类别,具体过程如下:步骤2.3.1、根据表K中每个关键词的K_papers,即文献ID集合字段,计算两两关键词之间的Jaccard相似度,即两个关键词各自的K_papers字段中相同文献ID的数量与它们的并集中元素数量的比值为两个关键词之间的相似度;步骤2.3.2、先将每个关键词归为一类,每类仅包含一个关键词,这样N个关键词共得到N类;根据步骤2.3.1所计算的关键词之间的相似度,即可得到类与类之间的相似度;步骤2.3.3、寻找各个类之间相似度最大的两个类,并合并成一类,于是总的类数少了一个,记录此时关键词聚类结果Ri,其中i是此时类的总数,Ri是每个关键词所属类构成的集合;步骤2.3.4、重新计算新合并的这个类与所有旧类之间的相似度;步骤2.3.5、重复步骤2.3.3和2.3.4直到最后类数为1,即所有关键词聚为一类,结束聚类;由于重复步骤2.3.3,每次会得到一个聚类结果,最后得到聚类结果集,表示成R,R1,R2,…Ri;i≤N;步骤2.3.6、对于2.3.5步骤得到的关键词聚类结果集R中的每个聚类结果Ri,1≤i≤N,分别计算它们的轮廓系数S(Ri),并选择轮廓系数最大的聚类结果作为最终关键词聚类结果,记为Rm,其中轮廓系数S(Ri)计算方法:S(Ri)=Σk=1NS(k)N]]>其中,N为关键词的个数,S(k)为每个关键词k的轮廓系数,计算方式为:S(k)=b(k)-a(k)max{a(k),b(k)}]]>其中,a(k)表示k与所有和k属于同一类别的其它点的相似度的平均值;b(k)表示k与所有和k不属于同一类别的其它点的平均相似度的最小值;步骤2.3.7、由于确定最终关键词聚类结果为Rm,即确定每个关键词所属类,根据相同类的关键词具有相同编号,用阿拉伯数字对类进行编号,然后将每个关键词的编号作为它的类别存入关键词表K中的Cluster字段中;步骤2.4、确定每篇文献的模式根据表D中每篇文献的Keywords字段,在表K的Cluster字段中一一查询该关键词集所对应的类别集合,从而获得每篇文献的关键词集的类别组合,即作为该文献的模式,并将其存入表D的Paper_mode字段;步骤3、根据用户正在浏览的文献,获取该文献的模式,给用户推荐与该文献模式具有共性特征的文献集合,过程如下:步骤3.1、提取用户正在访问的某文献的关键词集合,查找表K获得各关键词的类别,从而获得该文献的关键词集的类别组合,即为该文献的模式;步骤3.2、根据步骤3.1所获得的文献模式,查找表D,提取与该模式相同的文献集合推荐给用户,所推荐的文献集合与用户所访问的文献具有相同的模式,即为共性模式文献集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京林业大学,未经北京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710472900.X/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





