[发明专利]一种基于文章评论的推荐方法及装置有效
申请号: | 201811084474.3 | 申请日: | 2018-09-17 |
公开(公告)号: | CN109189892B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 孔滕;王国斐 | 申请(专利权)人: | 北京一点网聚科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9535 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴迪 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文章 评论 推荐 方法 装置 | ||
本发明实施例提供的一种基于文章评论的推荐方法及装置,属于计算机技术领域。该方法包括:采集用户评论;通过无监督聚类把所述评论分成N个类;通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词;通过浅层神经网络对所述关键词进行扩展,生成多个评论大类的评论词库;确定待处理评论与所述评论词库是否匹配;若所述待处理评论与所述评论词库中任一所述评论大类匹配,将所述评论大类对应的文章推荐给所述用户。从而给文章扩展更多维度的特征标签,从而有效提高对文章推荐的精准度。进而克服现有技术存在的无法精准推荐的技术问题。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种基于文章评论的推荐方法及装置。
背景技术
目前的内容推荐模式主要根据用户基础信息、用户行为计算用户画像,再根据文章基本信息(包括标题、内容、来源等)计算文章画像,然后通过相关性计算,推荐匹配该用户画像的文章。但是某些维度的特征仅仅通过文章主体很难识别或者识别代价较高,如标题党(文章内容与标题不符)、抄袭文章、谣言、内含广告等。
发明内容
本发明实施例提供的一种基于文章评论的推荐方法及装置,可以解决现有技术中存在的无法精确识别文章的技术问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供的一种基于文章评论的推荐方法,包括:采集用户评论;通过无监督聚类把所述评论分成N个类;通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词;通过浅层神经网络对所述关键词进行扩展,生成多个评论大类的评论词库;确定待处理评论与所述评论词库是否匹配;若所述待处理评论与所述评论词库中任一所述评论大类匹配,将所述评论大类对应的文章推荐给所述用户。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,在确定待处理评论与所述评论词库是否匹配之后,还包括:若所述待处理评论与所述评论词库中任一所述评论大类均不匹配,过滤所述待处理评论。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,将所述评论大类对应的文章推荐给所述用户,包括:确定所述评论大类对应的文章是否满足预设要求;若是,通过多渠道将所述文章推荐给所述用户。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,在确定所述评论大类对应的文章是否满足预设要求之后,还包括:若所述评论大类对应的文章不满足所述预设要求,对所述待处理评论进行标注;将标注后的所述待处理评论进行聚类处理。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词,包括:通过卡方检验和信息增益的方法从所述N个类中确定候选集;根据预设词向量对所述候选集进行K-means聚类,得到M个类;确定所述候选集中的词向量与对应所述M个类的相关性以及信息熵,将所述信息熵小的候选词选出,作为所述关键词。
第二方面,本发明实施例提供的一种基于文章评论的推荐装置,包括:采集单元,用于采集用户评论;第一处理单元,用于通过无监督聚类把所述评论分成N个类;第二处理单元,用于通过信息增益、卡方检验的方式找出所述N个类中最具有代表性的关键词;第三处理单元,用于通过浅层神经网络对所述关键词进行扩展,生成多个评论大类的评论词库;第四处理单元,用于确定待处理评论与所述评论词库是否匹配;推荐单元,用于若所述待处理评论与所述评论词库中任一所述评论大类匹配,将所述评论大类对应的文章推荐给所述用户。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,在所述第四处理单元之后,所述装置还包括:第五处理单元,用于若所述待处理评论与所述评论词库中任一所述评论大类均不匹配,过滤所述待处理评论。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一点网聚科技有限公司,未经北京一点网聚科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811084474.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于多种领域的中文分析平台
- 下一篇:一种自动检索的方法和装置