[发明专利]一种对评论有用性进行判断和筛选的方法与装置在审

专利信息
申请号: 202110496262.1 申请日: 2021-05-07
公开(公告)号: CN113282704A 公开(公告)日: 2021-08-20
发明(设计)人: 汤凌燕;王嫄;熊聪聪;刘玉桥;杨巨成;赵婷婷;陈亚瑞;潘旭冉 申请(专利权)人: 天津科技大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/338;G06F40/216;G06F40/242;G06F40/289;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 代理人: 符继超
地址: 300457 天津市滨*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 评论 有用 进行 判断 筛选 方法 装置
【权利要求书】:

1.一种对评论有用性进行判断和筛选的方法,其特征在于,包括:

获取多条待判断的评论数据,对所述待判断的评论数据进行预处理;

将每条所述预处理后的评论数据输入情感分析模型,输出评论情感得分;

将每条所述预处理后的评论数据输入主题分析模型,输出词频总权重和评论主题排序;

将每条所述预处理后的评论数据输入可信度分析模型,输出评论者可信度得分;

根据所述评论情感得分、词频总权重、评论者可信度得分及在所述评论数据中提取的语义特征,进行加权求和,得到评论有用性得分;

将所述评论有用性得分与预设阈值相比较,判断和筛选出高效有用评论。

2.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,还包括:

根据阅读者的网络特征,并结合所述评论主题排序,输出基于阅读者特征的高效有用评论排序结果。

3.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,对待判断的评论数据进行预处理,包括:

对所述待判断的评论数据进行清洗;

对清洗后的所述评论数据进行分词处理;

对分词后的所述评论数据进行词性标注和标点符号标注。

4.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述情感分析模型的训练步骤包括:

构建长短时记忆网络;

将情感分析的训练样本数据输入所述长短时记忆网络进行训练;所述情感分析的训练样本数据由word2vec转换为特征向量;所述情感分析的训练样本数据为带有评论情感得分的标识;所述评论情感得分由词情感极性值和标点符号情感极性值,加权求和获得;所述词情感极性值由评论中各个词与领域情感词典进行余弦相似度匹配计算获得;

判断训练得到的模型是否满足第一预设条件;

当训练得到的模型满足第一预设条件时,确定所述训练得到的模型为情感分析模型。

5.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述主题分析模型的训练步骤包括:

构建卷积神经网络;

将主题分析的训练样本数据输入所述卷积神经网络进行训练;所述主题分析的训练样本数据由word2vec转换为特征向量;所述主题分析的训练样本数据为带有词频总权重和评论主题排序的标识;其中,所述词频总权重由主题权重和词频权重进行加权求和获得;所述词频权重由TF-IDF计算获得;所述主题权重和所述评论主题排序,由LDA统计和提取;

判断训练得到的模型是否满足第二预设条件;

当训练得到的模型满足第二预设条件时,确定所述训练得到的模型为主题分析模型。

6.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述可信度分析模型的训练步骤包括:

构建图形卷积神经网络;

将可信度分析的训练样本数据输入所述图形卷积神经网络进行训练;所述可信度分析的训练样本数据由word2vec转换为特征向量;所述可信度分析的训练样本数据为带有评论者可信度得分的标识;所述评论者可信度得分由专业性得分、信誉排名得分和人口学特征得分,加权求和获得;

判断训练得到的模型是否满足第三预设条件;

当训练得到的模型满足第三预设条件时,确定所述训练得到的模型为情感分析模型。

7.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述评论有用性得分还通过以下方式获得:由评论属性得分、所述评论情感得分、词频总权重和评论者可信度得分,进行加权求和。

8.一种对评论有用性进行判断和筛选的装置,其特征在于,包括:

获取及预处理模块,用于获取多条待判断的评论数据,对所述待判断的评论数据进行预处理;

情感分析模块,用于将每条所述预处理后的评论数据输入情感分析模型,输出评论情感得分;

主题分析模块,用于将每条所述预处理后的评论数据输入主题分析模型,输出词频权重和评论主题排序;

可信度分析模块,用于将每条所述预处理后的评论数据输入可信度分析模型,输出评论者可信度得分;

计算模块,用于根据所述评论情感得分、词频总权重、评论者可信度得分及在所述评论数据中提取的语义特征,进行加权求和,得到评论有用性得分;

筛选模块,用于将所述评论有用性得分与预设阈值相比较,判断和筛选出高效有用评论;

排序模块,用于根据阅读者的网络特征,并结合所述评论主题排序,输出基于阅读者特征的高效有用评论排序结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110496262.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top