[发明专利]融合标题摘要语义关系的学术文献推荐方法在审

专利信息
申请号: 202210270510.5 申请日: 2022-03-18
公开(公告)号: CN114626369A 公开(公告)日: 2022-06-14
发明(设计)人: 陈泽华;陈雨民;吕传建;闫一帆 申请(专利权)人: 太原理工大学
主分类号: G06F40/258 分类号: G06F40/258;G06F40/30;G06F16/9535;G06N3/04;G06N3/08
代理公司: 太原晋科知识产权代理事务所(特殊普通合伙) 14110 代理人: 任林芳
地址: 030024 *** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 融合 标题 摘要 语义 关系 学术 文献 推荐 方法
【说明书】:

发明属于学术文献推荐领域,具体是一种融合标题摘要语义关系的学术文献推荐方法。解决了现有学术文献推荐方法存在的冷启动,数据稀疏性问题,包括以下步骤,S100:采集用户‑文献交互数据并进行数据预处理;S200:搭建结合文本与隐反馈信息的学术文献推荐网络;S300:将预处理后的数据集输入文献推荐网络,使用损失函数对文献推荐网络进行训练,并保存训练好的网络模型及参数;S400:使用训练好的网络计算每位用户对其它所有未交互过的文献的喜好分数,根据喜好分数对文献进行排序,选取前N篇文献推荐给用户。本发明有效保证学术文献推荐效果。

技术领域

本发明属于学术文献推荐领域,具体是一种融合标题摘要语义关系的学术文献推荐方法。

背景技术

学术文献是学者们在科学研究后,通过文章对自己的研究内容、方法、实验结果以及结论等进行总结凝练,是针对某一问题的系统性阐述与讨论,是一种有形的知识载体,具有极高价值。学者们通过学术文献获取某个学科或领域的最新研究进展、研究现状等科研信息,激发科学研究动机的出现和学术灵感的涌现。传统学术文献获取方式是阅读纸质文献,互联网时代,文献获取变的十分容易。互联网上充斥着大量学术文献,文献在信息世界里被不断转发、传播扩散,如何帮助研究者快速找到感兴趣的学术文献具有十分重要的意义,推荐系统为此打开了一种全新方式。

为了推动智慧图书馆的发展,必须充分利用海量资源数据,融合新兴技术,提升图书馆馆藏资源的利用率和用户满意度。推荐服务是当下图书馆个性化服务的核心内容,是图书馆将传统被动服务转变为主动服务的重要途径和方式,可以有效提高馆藏学术资源的利用率和用户满意度,为构建智能化、个性化、自动化的图书馆服务奠定基础。

基于内容过滤的文献推荐方法存在特征抽取表示效率低,推荐缺乏多样性和新颖性等问题。基于协同过滤的文献推荐方法提高了推荐文献的新颖性和多样性,但单纯使用协同过滤方法进行学术文献推荐将面临严重的数据稀疏问题。基于图的推荐假设引文拓扑能够准确反映文献之间的关联性,但该假设存在一些缺陷,新文献无法被旧文献引用,一些作者可能引用自己的无关的文献。混合推荐旨在将多个推荐方法结合起来弥补单个推荐方法存在的缺陷,是目前学术文献推荐的主流方向。现存方法都没有重视文献内容对于研究人员的关键作用,没有充分利用学术文献作为一种典型的结构化文本的特点。

发明内容

本发明为了解决现有学术文献推荐方法存在的冷启动,数据稀疏性问题,提供一种融合标题摘要语义关系的学术文献推荐方法。

本发明采取以下技术方案:一种融合标题摘要语义关系的学术文献推荐方法,包括以下步骤,S100:采集用户-文献交互数据并进行数据预处理;S200:搭建结合文本与隐反馈信息的学术文献推荐网络,文献推荐网络首先通过预训练BERT模型获得标题摘要中单词的向量表示,接着通过标题摘要注意力机制捕获标题摘要之间语义关系获得更好的文献向量表示,最后结合去掉项目嵌入模块的NCF模型处理用户-文献交互信息实现文献推荐;S300:将预处理后的数据集输入文献推荐网络,使用损失函数对文献推荐网络进行训练,并保存训练好的网络模型及参数;S400:使用训练好的网络计算每位用户对其它所有未交互过的文献的喜好分数,根据喜好分数对文献进行排序,选取前N篇文献推荐给用户。

步骤S100中,用户-文献交互数据为某位用户历史上是否收藏、浏览、点击过某篇文献,是则存在交互对,否则不存在,具体包括每个用户历史上交互过的文献以及对应文献的标题摘要文本。

步骤S100中,数据预处理包括数据集的清洗和负采样,其中数据集的清洗包括合并重复文章、移除无效文章、去除收藏少于10篇文献的用户;负采样为对每对交互按比例随机选取几对不存在的交互。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210270510.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top