[发明专利]一种异常评论文本的确定方法及装置有效
| 申请号: | 201810255066.3 | 申请日: | 2018-03-22 |
| 公开(公告)号: | CN108470065B | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 徐振中;肖依永;苑星龙 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴迪 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 异常 评论 文本 确定 方法 装置 | ||
1.一种异常评论文本的确定方法,其特征在于,包括:
获取待异常评论的多条评论文本;
计算所述多条评论文本中任意两条评论文本之间的相似度;
基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集;
对于任一分类评论文本集,将该任一分类评论文本集对应的评论文本输入预先训练的情感模型,得到该任一分类评论文本集对应的情感分数集;
对各所述分类评论文本集对应的情感分数集进行验证,获取异常分类评论文本集,确定所述异常分类评论文本集中的所有评论文本为所述异常评论文本;
所述对各所述分类评论文本集对应的情感分数集进行验证,获取异常分类评论文本集,包括:
对各个所述分类评论文本集对应的情感分数集分别进行正态分布验证,获取不符合所述正态分布验证结果的异常分类评论文本集。
2.根据权利要求1所述的方法,其特征在于,所述计算所述多条评论文本中任意两条评论文本之间的相似度,包括:
基于预设的相似度衡量模型,对任意一条评论文本进行向量转换,得到该任意一条评论文本的评论向量;
计算任意两个评论向量之间的相似度。
3.根据权利要求2所述的方法,其特征在于,所述基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集,包括:
依据任意两个评论向量之间的相似度,确定该任意两个评论向量之间的向量距离;
按照所述向量距离对所述多条评论文本进行分类,得到分类评论文本集。
4.根据权利要求2所述的方法,其特征在于,所述基于预设的相似度衡量模型,对任意一条评论文本进行向量转换之前,所述方法还包括:
对所述任意一条评论文本进行分词处理;
过滤掉进行分词处理后的所述任意一条评论文本中的停用词,得到关键词。
5.根据权利要求4所述的方法,其特征在于,所述基于预设的相似度衡量模型,对任意一条评论文本进行向量转换,得到该任意一条评论文本的评论向量,包括:
对于任意一条评论文本,依次将该任意一条评论文本中的各关键词转换为对应的数字信息;
基于依次转换得到的所述数字信息,生成该任意一条评论文本对应的评论向量。
6.根据权利要求3所述的方法,其特征在于,所述依据任意两个评论向量之间的相似度,确定该任意两个评论向量之间的向量距离,包括:
计算所述任意两个评论向量的余弦相似度;
取所述余弦相似度的倒数,记为所述任意两个评论向量之间的所述向量距离。
7.一种异常评论文本的确定装置,其特征在于,包括:
文本获取模块,用于获取待异常评论的多条评论文本;
文本处理模块,用于计算所述多条评论文本中任意两条评论文本之间的相似度;以及,用于基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集;
文本执行模块,用于对于任一分类评论文本集,将该任一分类评论文本集对应的评论文本输入预先训练的情感模型,得到该任一分类评论文本集对应的情感分数集;
文本确认模块,用于对各所述分类评论文本集对应的情感分数集进行验证,获取异常分类评论文本集,确定所述异常分类评论文本集中的所有评论文本为所述异常评论文本;
所述文本确认模块,具体用于:
对各个分类评论文本集对应的情感分数集分别进行正态分布验证,获取不符合正态分布验证结果的异常分类评论文本集。
8.根据权利要求7所述的装置,其特征在于,所述文本处理模块包括:
向量转换模块,用于基于预设的相似度衡量模型,对任意一条评论文本进行向量转换,得到该任意一条评论文本的评论向量;
向量计算模块,用于计算任意两个评论向量之间的相似度。
9.根据权利要求8所述的装置,其特征在于,所述文本处理模块还包括:
距离确定模块,用于依据任意两个评论向量之间的相似度,确定该任意两个评论向量之间的向量距离;
文本分类模块,用于按照所述向量距离对所述多条评论文本进行分类,得到分类评论文本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810255066.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于智能机器人的新闻稿生成方法
- 下一篇:一种移动互联网终端取证平台





