[发明专利]一种文本推荐方法、系统、存储介质和设备在审

申请号：	202111016193.6	申请日：	2021-08-31
公开（公告）号：	CN113688229A	公开（公告）日：	2021-11-23
发明（设计）人：	周劲;郭颖颖;韩士元;王琳;杜韬;纪科;张坤;赵亚欧	申请（专利权）人：	济南大学
主分类号：	G06F16/335	分类号：	G06F16/335;G06F16/35;G06F16/9535;G06F16/958
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	张庆骞
地址：	250022 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本推荐方法系统存储介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于文本推荐领域，提供了一种文本推荐方法、系统、存储介质和设备。其中，该方法包括获取待推荐文本的关键词；基于所述待推荐文本与已知属性文本的关键词，聚类所有待推荐文本；根据所有待推荐文本的关键词与已知文本属性的关键词之间的距离，依次推荐文本；其中，在聚类所有候选文本的过程中，考虑所有待推荐文本与已知属性文本的关键词之间的亲和度信息，将得到的亲和度与属性的权重相结合来构造基于维度亲和度的属性权重套索正则项，同时利用最大熵正则化，以实现属性权重的优化分布。

技术领域

本发明属于文本推荐领域，尤其涉及一种文本推荐方法、系统、存储介质和设备。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

随着大数据时代的到来，对于网站关键词的检索领域，网站关键词检索相关数据变得更加复杂，而且数据维度也越来越高。面对复杂多变的数据环境，相比于传统的聚类算法已经不再适用。为了解决高维数据这一问题，大量先进的子空间聚类算法被广泛研究。

发明人发现，面对高维数据特征之间的稀疏性和复杂性，目前的子空间聚类算法仍然难以有效的挖掘数据特征之间潜在的非线性信息，即基于数据特征亲和度的信息表示，无法获得较好的聚类效果，从而降低了待检索文本推荐的准确性。

发明内容

为了解决上述背景技术中存在的技术问题，本发明提供一种文本推荐方法、系统、存储介质和设备，其能够提高待检索文本推荐的准确性。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一个方面提供一种文本推荐方法，其包括：

获取待推荐文本的关键词；

基于所述待推荐文本与已知属性文本的关键词，聚类所有待推荐文本；