[发明专利]基于深度学习的科研学术新闻关键字匹配推荐方法有效
申请号: | 201911408925.9 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111061939B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 孟海宁;冯锴;朱磊;白涛;王锋;石月开;童新宇;姚燕妮;董林靖;陈毅 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/289;G06V10/762;G06V10/22;G06V40/16 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 张皎 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 科研 学术 新闻 关键字 匹配 推荐 方法 | ||
本发明公开了一种基于深度学习的科研学术新闻关键字匹配推荐方法。所采用的推荐方法是基于两个不断充实的新闻库和论文库,用图片识别、分词结合概率统计方法、centence2vec方法相结合形成关键词库,从而构建word2vec模型,用语言处理判断其内容的相似度并根据相似度进行推荐。以达到当用户浏览科研新闻时,能够向其推荐相关度由高到低的一些学术论文,达到对新闻内容观点题共论文支持的期望;反之,在用户浏览学术论文时,能够向其推荐与此论文相似的科研新闻,以便让读者了解有关于当前论文所阐述观点或者技术的最新发展或信息。
技术领域
本发明属于机器学习领域的一个重要的方向,具体涉及面向科研新闻和学术论文的关键字匹配推荐方法。
背景技术
伴随着计算机科学技术的发展,机器学习领域在深度学习方向也得到了具有现实意义和应用前景的进展。这也为解决我们如何在庞大的信息海洋中获取想要的数据或信息这一问题提供了一种可能的方法。互联网水平的高速发展同时促进了各行各业科研水平的不断进步,与此同时科研学术文献和与科研学术有关的新闻的数量与日俱增。当研究人员查阅某一科研新闻时,得到的观点往往不甚明确,此时向其推荐一些与本新闻学术观点相近或相似的一些论文是十分有必要的。这种做法加强了科研新闻与学术论文之间的联系,有着论文的背景支撑,也使得新闻的可信度增强。此过程也是可逆的,当浏览学术论文时,向浏览的用户推荐一些与被浏览论文学术观点相似或相近的新闻,使读者能够了解此论文观点或技术的最新发展。
目前,推荐算法大多是基于内容的个性化推荐,推荐的客体也大多是普通用户所感兴趣的新闻、商品、音乐等。缺失纯粹基于科研新闻库和学术论文库进行互相推荐的实例。在推荐方法上,以推荐方法比较好的淘宝为例,是利用用户的一些行为,通过一些数学算法,从而推测出用户可能喜欢或者可能会购买的商品。此外还有基于内容、基于协同、基于效用、基于知识和组合推荐多种推荐方法。本发明所采用的推荐方法是基于两个不断充实的新闻库和论文库,用语言处理判断其内容的相似度并根据相似度进行推荐。综上所述,一种纯粹的关于科研新闻和学术论文相互推荐的问题是十分有价值和意义提出的,本发明旨针对此种情况提出了一种解决的方法。
发明内容
本发明旨在提供一种根据科研新闻推荐学术论文的方法,本过程是可逆的。具有帮助研究者或用户节省论文查阅时间,帮助科研新闻提供学术论文观点支撑,根据当前论文库已有学术论文和查阅的科研新闻进行关键字匹配推荐学术论文的特点。
本发明的关键在于如何界定科研新闻与学术论文的“相似”,所采用的方法是基于两个关键词库的相似性检测从而达到关键字匹配的效果。所采用的技术方案是,当每一个管理员以自身ID登录时,记录其ID和他执行的操作。如上传新闻或论文、修改新闻或论文等,然后对于其变动的数据进行数据集成。目的在于生成科研新闻数据库和学术论文数据库节点及其关系创建语句,并根据关系关键字推送相关的新闻或论文。以根据所浏览科研新闻推荐学术论文为例,包括以下步骤:
步骤1,网站管理员输入新闻数据和学术、科研论文数据;
步骤2,新闻数据集成到新闻数据库,学术、科研论文数据集成到论文库;
步骤3,新闻分为图片新闻和文字新闻,图片新闻利用构建BOW模型进行图片识别,提取出图片中的文字和人物信息。对于文字新闻采用对新闻分词处理和词汇概率统计手段相结合的手段对文字新闻进行处理,最终集合两者的数据形成新闻关键词库;
步骤4,对于论文库,首先是提取论文中自带的关键词数据形成关键词集合。其次是对于论文的标题、正文等采用sentence2vec的C-bow方法进行语义识别。最终集合两者的数据形成论文关键词库;
步骤5,对新闻关键词库和论文关键词库进行整合,构建word2vec模型并对模型进行训练,旨在挖掘关键词之间的关系。最终达到的效果是:输入一个关键词,能根据输入的关键词对关键词库进行遍历,从而的得到一个与关键词相关性由大到小的数据集。这个数据集将是我们进行推荐工作的基准;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911408925.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属锆母体原料用电熔氧化锆的制备方法
- 下一篇:一种管件下料卡紧工装