[发明专利]一种基于词嵌入和多值形式概念分析的论文推荐方法及装置有效
| 申请号: | 201911169957.8 | 申请日: | 2019-11-26 |
| 公开(公告)号: | CN111090743B | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 蒋运承;朱星图;詹捷宇;马文俊;刘宇东;李亚扬 | 申请(专利权)人: | 华南师范大学 |
| 主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
| 地址: | 510631 广东省广州市天*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 嵌入 形式 概念 分析 论文 推荐 方法 装置 | ||
本发明提供一种基于词嵌入和多值形式概念分析的论文推荐方法及装置,包括建立对象为论文、属性为所有论文的关键词的形式概念背景表;从所述形式概念背景表中,抽取形式概念的内涵和外延,得到若干形式概念;计算每个所述形式概念中每个所述关键词的词向量,并根据每个所述词向量,计算所述形式概念的第一中心向量;获取用户关键词,计算所述用户关键词的第二中心向量;计算所述第二中心向量与每个所述形式概念的第一中心向量之间的距离,根据所述距离的大小向用户推荐所述距离较小的形式概念中的论文。相对于现有技术,本发明更好地描述了论文与关键词的关联性,提高了论文推荐的效率和精准性。
技术领域
本发明涉及推荐技术领域,特别是涉及一种基于词嵌入和多值形式概念分析的论文推荐方法及装置。
背景技术
随着互联网技术的高速发展,越来越多的学术网站出现并被科研工作者所使用,比如著名的中国知网、百度学术、万方数据库等。在用户进行搜索时,提供相关的搜索语句,网站就会从大量的论文数据中快速的获取相关论文,并推荐给用户,这无疑使科研人员之间的交流和获取信息变得格外容易和方便。但学术网站在提供极大便利的同时,信息过载已经成为科研工作者所面临的主要困境之一,科研工作者难以快速从大量的推荐论文中获取有效信息,因此如何提高推荐的精准度和效率成为了难题。
目前,现有技术中有大量通过词嵌入实现论文推荐的聚类算法,主要是利用Word2Vec、GloVe等通过浅层神经网络实现词嵌入的工具,将论文中的关键信息映射到带有语义关系的向量,并通过层次聚类、密度聚类等聚类算法进行词向量聚类,获取推荐论文。但是,上述方法在处理大量文本时有非常高的时空复杂度,并且不能全面地描述论文与关键词之间的关系,导致论文的推荐效率和精准度均较低。
发明内容
为克服相关技术中存在的问题,本发明实施例提供了一种基于词嵌入和多值形式概念分析的论文推荐方法及装置。
根据本发明实施例的第一方面,提供一种论文推荐方法,包括如下步骤:
建立对象为论文、属性为所有论文的关键词的形式概念背景表,所述形式概念背景表中的关系指示每篇论文与每个关键词之间的对应关系;
从所述形式概念背景表中,抽取形式概念的内涵和外延,得到若干形式概念,其中,每个形式概念中外延里的论文都与内涵里的每个关键词有相同的对应关系;
计算每个所述形式概念中每个所述关键词的词向量,并根据每个所述词向量,计算所述形式概念的第一中心向量;
获取用户关键词,计算所述用户关键词的第二中心向量;
计算所述第二中心向量与每个所述形式概念的第一中心向量之间的距离,根据所述距离的大小向用户推荐所述距离较小的形式概念中的论文。
相对于现有技术,本发明(申请)实施例利用形式概念分析的原理进行形式概念的提取,将具有相同的对应关系的论文和关键词进行整合,更全面地描述了论文与关键词的关联性,并且,避免了形式概念分析中概念格的生成,降低了算法的时空复杂度,提高了推荐效率。同时,通过词向量技术将关键词转换为词向量,能够更好地计算出用户关键词与形式概念中关键词的相似度,进一步提高了论文推荐的精准性。
在一个可选的实施例中,所述对应关系包括:
每篇所述论文具有该关键词的概率;
所述相同的对应关系包括:每篇所述论文具有该关键词的概率大于第一阈值。
通过引入概率的计算,实现了多值形式概念分析,使得在论文推荐的过程中,不仅仅关注论文原有的关键词,也同时关注论文具有该关键词概率较高的关键词,提高论文推荐的精准度。
在一个可选的实施例中,获取每篇论文中具有每个关键词的概率的步骤包括:
将所有关键词转换为词向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911169957.8/2.html,转载请声明来源钻瓜专利网。





