[发明专利]一种对评论有用性进行判断和筛选的方法与装置在审

申请号：	202110496262.1	申请日：	2021-05-07
公开（公告）号：	CN113282704A	公开（公告）日：	2021-08-20
发明（设计）人：	汤凌燕;王嫄;熊聪聪;刘玉桥;杨巨成;赵婷婷;陈亚瑞;潘旭冉	申请（专利权）人：	天津科技大学
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/338;G06F40/216;G06F40/242;G06F40/289;G06F40/30;G06N3/04;G06N3/08
代理公司：	北京慕达星云知识产权代理事务所(特殊普通合伙) 11465	代理人：	符继超
地址：	300457 天津市滨***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种评论有用进行判断筛选方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种对评论有用性进行判断和筛选的方法，其特征在于，包括：

获取多条待判断的评论数据，对所述待判断的评论数据进行预处理；

将每条所述预处理后的评论数据输入情感分析模型，输出评论情感得分；

将每条所述预处理后的评论数据输入主题分析模型，输出词频总权重和评论主题排序；

将每条所述预处理后的评论数据输入可信度分析模型，输出评论者可信度得分；

根据所述评论情感得分、词频总权重、评论者可信度得分及在所述评论数据中提取的语义特征，进行加权求和，得到评论有用性得分；

将所述评论有用性得分与预设阈值相比较，判断和筛选出高效有用评论。

2.如权利要求1所述的一种对评论有用性进行判断和筛选的方法，其特征在于，还包括：

根据阅读者的网络特征，并结合所述评论主题排序，输出基于阅读者特征的高效有用评论排序结果。

3.如权利要求1所述的一种对评论有用性进行判断和筛选的方法，其特征在于，对待判断的评论数据进行预处理，包括：

对所述待判断的评论数据进行清洗；

对清洗后的所述评论数据进行分词处理；

对分词后的所述评论数据进行词性标注和标点符号标注。

4.如权利要求1所述的一种对评论有用性进行判断和筛选的方法，其特征在于，所述情感分析模型的训练步骤包括：

构建长短时记忆网络；

将情感分析的训练样本数据输入所述长短时记忆网络进行训练；所述情感分析的训练样本数据由word2vec转换为特征向量；所述情感分析的训练样本数据为带有评论情感得分的标识；所述评论情感得分由词情感极性值和标点符号情感极性值，加权求和获得；所述词情感极性值由评论中各个词与领域情感词典进行余弦相似度匹配计算获得；

判断训练得到的模型是否满足第一预设条件；

当训练得到的模型满足第一预设条件时，确定所述训练得到的模型为情感分析模型。

5.如权利要求1所述的一种对评论有用性进行判断和筛选的方法，其特征在于，所述主题分析模型的训练步骤包括：

构建卷积神经网络；

将主题分析的训练样本数据输入所述卷积神经网络进行训练；所述主题分析的训练样本数据由word2vec转换为特征向量；所述主题分析的训练样本数据为带有词频总权重和评论主题排序的标识；其中，所述词频总权重由主题权重和词频权重进行加权求和获得；所述词频权重由TF-IDF计算获得；所述主题权重和所述评论主题排序，由LDA统计和提取；

判断训练得到的模型是否满足第二预设条件；

当训练得到的模型满足第二预设条件时，确定所述训练得到的模型为主题分析模型。

6.如权利要求1所述的一种对评论有用性进行判断和筛选的方法，其特征在于，所述可信度分析模型的训练步骤包括：

构建图形卷积神经网络；

将可信度分析的训练样本数据输入所述图形卷积神经网络进行训练；所述可信度分析的训练样本数据由word2vec转换为特征向量；所述可信度分析的训练样本数据为带有评论者可信度得分的标识；所述评论者可信度得分由专业性得分、信誉排名得分和人口学特征得分，加权求和获得；

判断训练得到的模型是否满足第三预设条件；

当训练得到的模型满足第三预设条件时，确定所述训练得到的模型为情感分析模型。

7.如权利要求1所述的一种对评论有用性进行判断和筛选的方法，其特征在于，所述评论有用性得分还通过以下方式获得：由评论属性得分、所述评论情感得分、词频总权重和评论者可信度得分，进行加权求和。

8.一种对评论有用性进行判断和筛选的装置，其特征在于，包括：

获取及预处理模块，用于获取多条待判断的评论数据，对所述待判断的评论数据进行预处理；

情感分析模块，用于将每条所述预处理后的评论数据输入情感分析模型，输出评论情感得分；

主题分析模块，用于将每条所述预处理后的评论数据输入主题分析模型，输出词频权重和评论主题排序；