[发明专利]一种基于聚类算法和局部感知重构模型的作者推荐方法和系统有效
| 申请号: | 201810135040.5 | 申请日: | 2018-02-09 |
| 公开(公告)号: | CN108427723B | 公开(公告)日: | 2021-08-06 |
| 发明(设计)人: | 张海军;王双 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
| 主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06K9/62 |
| 代理公司: | 深圳市迪斯卓越专利代理事务所(普通合伙) 44443 | 代理人: | 闵华明;李小艳 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 算法 局部 感知 模型 作者 推荐 方法 系统 | ||
本发明提出了一种基于聚类算法和局部感知重构模型的作者推荐方法及其系统,通过作者相关信息的树形结构表达、节点的特征表达、层次节点的位置映射、局部感知重构模型的建立,将由树形结构表示的作者信息转化为统一的向量表示,该向量包含了作者的相关信息及与作者相关的各层次的结构信息。进一步地,根据作者信息的统一向量表示,进行相关作者的推荐和检索。所述方法包括:A、树形结构表达;B、节点特征表达;C、层次节点位置映射;D、建立和求解局部感知重构模型;E、树形结构的统一向量表示;F、基于内容的作者推荐和检索。
技术领域
本发明属于文本挖掘和推荐系统领域,将异构信息数据按照其内部逻辑结构,组织形成树形结构,通过各层次的聚类及局部感知重构模型,实现有效的树形结构向量表示,所述方法及系统使用来自于不同域的作者信息最原始输入。
背景技术
随着互联网技术的不断推进和发展,网络数据规模日益扩大。数据的来源及数据的组织形式依据不同的应用场景具有多样性。对于每一个用户,与之相关的数据来源具有多样性,如果能够将这些数据进行有效的组织、提取、融合,则最终能够获得与该用户更为全面的信息表示。例如,对于某一作者来说,与该作者相关的不同来源的数据能够体现出与这个作者有关的不同层面的信息。具体地,该作者的背景简介、该作者所著书的简介、读者对该作者所著书的评论信息,能够从不能层面反映该作者的信息,且依据各部分数据集的内在逻辑特征,可以将这三部分数据集组织形成树形结构,从而体现数据的层次关系,有利于层次间信息的相互补充及异构信息的融合。
对于树形结构数据的向量化表示方法,尚未有针对性的研究。在已有的较为相关的工作中,主要是进行树形结构底层信息的低维度映射,从而实现信息的融合,但并未考虑树形结构数据的层次结构特征。因此,针对于树形结构数据,本研究考虑到树形结构数据的结构特征,逐层提取树形结构数据的各层次信息,并自底向上进行逐层的信息融合,最终获得统一结构的向量表示,进一步将形成的向量应用于分类或聚类。
“词袋”模型作为典型的基于全文内容表达的研究方法,该类方法的目的在于获得能够表示整篇文档内容的向量。但该类方法仅依赖于对于文本中词语的词频统计,而忽略了词语的空间分布信息,导致该方法很难区分出词频相似但词语的空间分布有差异的两个样本。因此,为了获得更准确的作者信息的向量表达,在本发明的建模过程中考虑了作者各层次信息的空间特征。
树形结构作为一种有效的数据组织和表达方式,可以体现出数据内部的层次关系和空间结构特征。因此,可以将与作者相关的信息按照“作者简介-书的简介-作者评论”的方式进行组织,形成一棵三层的树形结构,从而体现出作者信息的空间结构特征,在一定程度上弥补“词袋”模型对于文本空间信息的忽略。但按照树形结构进行组织的数据不便于样本间相似度的计算,因此需要对树形结构数据的层次信息进一步的整合,从而形成统一的向量表示,以便于实现进一步的系统推荐。
为了实现树形结构数据的层次信息整合,本发明中提出了一种基于聚类算法和局部感知重构模型的作者推荐系统。对于某一个两层子树,通过K-means聚类算法实现叶子节点信息的位置映射从而保存节点的全局信息,通过使用孩子节点信息重构其父节点信息获取对父节点的补充信息,进而获得该子树的局部向量表示,并更新该父节点的向量表示,该过程自底向上,直至将树形结构数据转化为统一的向量表示,从而使得该向量包含了该树形结构数据的层次信息。
发明内容
本发明的目的在于提供一种基于聚类算法和局部感知重构模型的作者推荐系统,旨在解决现有技术中存在的问题。
本发明通过以下技术方案实现:一种基于聚类算法和局部感知重构模型的作者推荐系统,所述方法包括以下步骤:
A、树形结构表达模块:对于每一位作者,将作者的背景信息、作者所著书的简介信息、每一本书的作者评论信息,按照内部逻辑结构信息组织成为“作者简介-书的简介-读者评论”的三层作者树结构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810135040.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能交互方法、电子装置及存储介质
- 下一篇:一种网络局部社团挖掘方法





