[发明专利]用户评论的排序方法、电子设备及计算机存储介质有效
| 申请号: | 201710651375.8 | 申请日: | 2017-08-02 |
| 公开(公告)号: | CN107391729B | 公开(公告)日: | 2018-09-04 |
| 发明(设计)人: | 柳燕煌;王海璐 | 申请(专利权)人: | 掌阅科技股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘兰兰 |
| 地址: | 100124 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 评论 排序 方法 电子设备 计算机 存储 介质 | ||
1.一种用户评论的排序方法,其包括:
通过第一种机器学习算法确定各个评论样本所对应的隐语义特征以及用户评论所对应的隐语义特征,根据每个评论样本所对应的隐语义特征确定该评论样本的特征向量;其中,将各个评论样本以及用户评论共同添加到同一个训练集合中,使评论样本与用户评论能够在同一个空间中进行训练,以挖掘评论样本与用户评论之间潜在的语义联系,并根据所述潜在的语义联系确定每个评论样本以及用户评论所对应的隐语义特征;其中,将全部待排序的用户评论与评论样本一起进行训练;
通过第二种机器学习算法,并结合各个评论样本的样本标注结果对各个评论样本的特征向量进行训练,得到评论排序模型;
根据每个用户评论所对应的隐语义特征确定该用户评论的特征向量,通过所述评论排序模型确定与各个用户评论的特征向量相对应的评价得分;
根据与各个用户评论的特征向量相对应的评价得分对各个用户评论进行排序;
其中,每当待预测的用户评论的数量及内容发生变化后相应地更新评论排序模型。
2.根据权利要求1所述的方法,其中,所述通过第一种机器学习算法确定各个评论样本所对应的隐语义特征以及用户评论所对应的隐语义特征的步骤具体包括:
将各个评论样本以及用户评论添加到训练集合中进行训练,根据训练结果确定各个评论样本以及用户评论所对应的隐语义特征。
3.根据权利要求2所述的方法,其中,每个评论样本以及用户评论具有对应的评论标识,则所述根据训练结果确定各个评论样本以及用户评论所对应的隐语义特征的步骤具体包括:
根据各个评论样本以及用户评论的评论标识确定对应的隐语义特征。
4.根据权利要求1所述的方法,其中,所述根据每个评论样本所对应的隐语义特征确定该评论样本的特征向量的步骤具体包括:
确定每个评论样本所对应的预设特征,将该评论样本的预设特征与该评论样本的隐语义特征进行组合,根据组合结果得到该评论样本的特征向量;和/或,
所述根据每个用户评论所对应的隐语义特征确定该用户评论的特征向量的步骤具体包括:
确定每个用户评论所对应的预设特征,将该用户评论的预设特征与该用户评论的隐语义特征进行组合,根据组合结果得到该用户评论的特征向量。
5.根据权利要求4所述的方法,其中,所述将该评论样本的预设特征与该评论样本的隐语义特征进行组合的步骤具体包括:将该评论样本的预设特征作为特征向量中的高阶特征,将该评论样本的隐语义特征作为特征向量中的低阶特征;和/或,所述将该用户评论的预设特征与该用户评论的隐语义特征进行组合的步骤具体包括:将该用户评论的预设特征作为特征向量中的高阶特征,将该用户评论的隐语义特征作为特征向量中的低阶特征。
6.根据权利要求4或5所述的方法,其中,各个评论样本以及用户评论所对应的隐语义特征为N维隐语义特征,各个评论样本以及用户评论所对应的预设特征为M维预设特征,则各个评论样本以及用户评论所对应的特征向量为S维特征向量;其中,N、M为大于1的自然数,S=N+M,并且,N大于或等于M;
其中,各个评论样本以及用户评论所对应的预设特征包括以下维度中的至少两个:评论时效性、评论全局重复度、评论敏感词出现次数、与书籍关键词相似度、评论字数、评论词数、评论中词的重复度、命中书籍关键词的个数、情感得分、点赞数、回复数、点赞比率、以及回复比率。
7.根据权利要求1-5任一所述的方法,其中,所述第一种机器学习算法包括以下中的至少一个:Word2Vec算法、LDA算法、以及矩阵分解算法;所述第二种机器学习算法包括以下中的至少一个:Pairwise Rank算法、以及SVMRank算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710651375.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据挖掘方法以及数据挖掘装置
- 下一篇:一种SQL语句处理方法及装置





