[发明专利]一种文本推荐方法、系统、存储介质和设备在审
| 申请号: | 202111016193.6 | 申请日: | 2021-08-31 | 
| 公开(公告)号: | CN113688229A | 公开(公告)日: | 2021-11-23 | 
| 发明(设计)人: | 周劲;郭颖颖;韩士元;王琳;杜韬;纪科;张坤;赵亚欧 | 申请(专利权)人: | 济南大学 | 
| 主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F16/9535;G06F16/958 | 
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 | 
| 地址: | 250022 山东*** | 国省代码: | 山东;37 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 文本 推荐 方法 系统 存储 介质 设备 | ||
本发明属于文本推荐领域,提供了一种文本推荐方法、系统、存储介质和设备。其中,该方法包括获取待推荐文本的关键词;基于所述待推荐文本与已知属性文本的关键词,聚类所有待推荐文本;根据所有待推荐文本的关键词与已知文本属性的关键词之间的距离,依次推荐文本;其中,在聚类所有候选文本的过程中,考虑所有待推荐文本与已知属性文本的关键词之间的亲和度信息,将得到的亲和度与属性的权重相结合来构造基于维度亲和度的属性权重套索正则项,同时利用最大熵正则化,以实现属性权重的优化分布。
技术领域
本发明属于文本推荐领域,尤其涉及一种文本推荐方法、系统、存储介质和设备。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着大数据时代的到来,对于网站关键词的检索领域,网站关键词检索相关数据变得更加复杂,而且数据维度也越来越高。面对复杂多变的数据环境,相比于传统的聚类算法已经不再适用。为了解决高维数据这一问题,大量先进的子空间聚类算法被广泛研究。
发明人发现,面对高维数据特征之间的稀疏性和复杂性,目前的子空间聚类算法仍然难以有效的挖掘数据特征之间潜在的非线性信息,即基于数据特征亲和度的信息表示,无法获得较好的聚类效果,从而降低了待检索文本推荐的准确性。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种文本推荐方法、系统、存储介质和设备,其能够提高待检索文本推荐的准确性。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种文本推荐方法,其包括:
获取待推荐文本的关键词;
基于所述待推荐文本与已知属性文本的关键词,聚类所有待推荐文本;
根据所有待推荐文本的关键词与已知文本属性的关键词之间的距离,依次推荐文本;
其中,在聚类所有候选文本的过程中,考虑所有待推荐文本与已知属性文本的关键词之间的亲和度信息,将得到的亲和度与属性的权重相结合来构造基于维度亲和度的属性权重套索正则项,同时利用最大熵正则化,以实现属性权重的优化分布。
进一步地,所述亲和度信息采用非线性核函数来挖掘;其中,Di表示第i个关键词,Dj表示第j个关键词,σ表示求解两个关键词相似度的一个核函数的参数。
进一步地,每一个文本的关键词就是每一条数据的特征。
进一步地,利用交替方向乘子法迭代优化属性权重,最终聚类出所有待推荐文本。
进一步地,所有关键词的亲和度构成的矩阵的对角线上的元素均为0。
本发明的第二个方面提供一种文本推荐系统,其包括:
关键词获取模块,其用于获取待推荐文本的关键词;
文本聚类模块,其用于基于所述待推荐文本与已知属性文本的关键词,聚类所有待推荐文本;
文本推荐模块,其用于根据所有待推荐文本的关键词与已知文本属性的关键词之间的距离,依次推荐文本;
其中,在所述文本聚类模块中聚类所有候选文本的过程中,考虑所有待推荐文本与已知属性文本的关键词之间的亲和度信息,将得到的亲和度与属性的权重相结合来构造基于维度亲和度的属性权重套索正则项,同时利用最大熵正则化,以实现属性权重的优化分布。
本发明的第三个方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的文本推荐方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111016193.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光学系统及光学设备
 - 下一篇:一种高钨钢及其制备方法
 





