[发明专利]一种基于文章评论的推荐方法及装置有效
申请号: | 201811084474.3 | 申请日: | 2018-09-17 |
公开(公告)号: | CN109189892B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 孔滕;王国斐 | 申请(专利权)人: | 北京一点网聚科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9535 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴迪 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文章 评论 推荐 方法 装置 | ||
1.一种基于文章评论的推荐方法,其特征在于,包括:
采集用户评论;
通过无监督聚类把所述评论分成N个类;
通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词;
通过浅层神经网络对所述关键词进行扩展,生成多个评论大类的评论词库;
确定待处理评论与所述评论词库是否匹配;
若所述待处理评论与所述评论词库中任一所述评论大类匹配,将所述评论大类对应的文章推荐给所述用户;
将所述评论大类对应的文章推荐给所述用户,包括:
确定所述评论大类对应的文章是否满足预设要求;
若所述评论大类对应的文章不满足所述预设要求,对所述待处理评论进行标注;
将标注后的所述待处理评论进行聚类处理。
2.根据权利要求1所述的方法,其特征在于,在确定待处理评论与所述评论词库是否匹配之后,还包括:
若所述待处理评论与所述评论词库中任一所述评论大类均不匹配,过滤所述待处理评论。
3.根据权利要求1所述的方法,其特征在于,在所述确定所述评论大类对应的文章是否满足预设要求之后,还包括:
若是,通过多渠道将所述文章推荐给所述用户。
4.根据权利要求1所述的方法,其特征在于,通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词,包括:
通过卡方检验和信息增益的方法从所述N个类中确定候选集;
根据预设词向量对所述候选集进行K-means聚类,得到M个类;
确定所述候选集中的词向量与对应所述M个类的相关性以及信息熵,将所述信息熵小的候选词选出,作为所述关键词。
5.一种基于文章评论的推荐装置,其特征在于,包括:
采集单元,用于采集用户评论;
第一处理单元,用于通过无监督聚类把所述评论分成N个类;
第二处理单元,用于通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词;
第三处理单元,用于通过浅层神经网络对所述关键词进行扩展,生成多个评论大类的评论词库;
第四处理单元,用于确定待处理评论与所述评论词库是否匹配;
推荐单元,用于若所述待处理评论与所述评论词库中任一所述评论大类匹配,将所述评论大类对应的文章推荐给所述用户;
所述推荐单元包括:
第一子单元,用于确定所述评论大类对应的文章是否满足预设要求;
第三子单元,用于若所述评论大类对应的文章不满足所述预设要求,对所述待处理评论进行标注;
第四子单元,用于将标注后的所述待处理评论进行聚类处理。
6.根据权利要求5所述的装置,其特征在于,在所述第四处理单元之后,所述装置还包括:
第五处理单元,用于若所述待处理评论与所述评论词库中任一所述评论大类均不匹配,过滤所述待处理评论。
7.根据权利要求5所述的装置,其特征在于,所述推荐单元包括:
第二子单元,用于若是,通过多渠道将所述文章推荐给所述用户。
8.根据权利要求5所述的装置,其特征在于,所述第二处理单元还用于:
通过卡方检验和信息增益的方法从所述N个类中确定候选集;
根据预设词向量对所述候选集进行K-means聚类,得到M个类;
确定所述候选集中的词向量与对应所述M个类的相关性以及信息熵,将所述信息熵小的候选词选出,作为所述关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一点网聚科技有限公司,未经北京一点网聚科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811084474.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于多种领域的中文分析平台
- 下一篇:一种自动检索的方法和装置