[发明专利]一种对评论有用性进行判断和筛选的方法与装置在审
申请号: | 202110496262.1 | 申请日: | 2021-05-07 |
公开(公告)号: | CN113282704A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 汤凌燕;王嫄;熊聪聪;刘玉桥;杨巨成;赵婷婷;陈亚瑞;潘旭冉 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F40/216;G06F40/242;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 300457 天津市滨*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 有用 进行 判断 筛选 方法 装置 | ||
1.一种对评论有用性进行判断和筛选的方法,其特征在于,包括:
获取多条待判断的评论数据,对所述待判断的评论数据进行预处理;
将每条所述预处理后的评论数据输入情感分析模型,输出评论情感得分;
将每条所述预处理后的评论数据输入主题分析模型,输出词频总权重和评论主题排序;
将每条所述预处理后的评论数据输入可信度分析模型,输出评论者可信度得分;
根据所述评论情感得分、词频总权重、评论者可信度得分及在所述评论数据中提取的语义特征,进行加权求和,得到评论有用性得分;
将所述评论有用性得分与预设阈值相比较,判断和筛选出高效有用评论。
2.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,还包括:
根据阅读者的网络特征,并结合所述评论主题排序,输出基于阅读者特征的高效有用评论排序结果。
3.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,对待判断的评论数据进行预处理,包括:
对所述待判断的评论数据进行清洗;
对清洗后的所述评论数据进行分词处理;
对分词后的所述评论数据进行词性标注和标点符号标注。
4.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述情感分析模型的训练步骤包括:
构建长短时记忆网络;
将情感分析的训练样本数据输入所述长短时记忆网络进行训练;所述情感分析的训练样本数据由word2vec转换为特征向量;所述情感分析的训练样本数据为带有评论情感得分的标识;所述评论情感得分由词情感极性值和标点符号情感极性值,加权求和获得;所述词情感极性值由评论中各个词与领域情感词典进行余弦相似度匹配计算获得;
判断训练得到的模型是否满足第一预设条件;
当训练得到的模型满足第一预设条件时,确定所述训练得到的模型为情感分析模型。
5.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述主题分析模型的训练步骤包括:
构建卷积神经网络;
将主题分析的训练样本数据输入所述卷积神经网络进行训练;所述主题分析的训练样本数据由word2vec转换为特征向量;所述主题分析的训练样本数据为带有词频总权重和评论主题排序的标识;其中,所述词频总权重由主题权重和词频权重进行加权求和获得;所述词频权重由TF-IDF计算获得;所述主题权重和所述评论主题排序,由LDA统计和提取;
判断训练得到的模型是否满足第二预设条件;
当训练得到的模型满足第二预设条件时,确定所述训练得到的模型为主题分析模型。
6.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述可信度分析模型的训练步骤包括:
构建图形卷积神经网络;
将可信度分析的训练样本数据输入所述图形卷积神经网络进行训练;所述可信度分析的训练样本数据由word2vec转换为特征向量;所述可信度分析的训练样本数据为带有评论者可信度得分的标识;所述评论者可信度得分由专业性得分、信誉排名得分和人口学特征得分,加权求和获得;
判断训练得到的模型是否满足第三预设条件;
当训练得到的模型满足第三预设条件时,确定所述训练得到的模型为情感分析模型。
7.如权利要求1所述的一种对评论有用性进行判断和筛选的方法,其特征在于,所述评论有用性得分还通过以下方式获得:由评论属性得分、所述评论情感得分、词频总权重和评论者可信度得分,进行加权求和。
8.一种对评论有用性进行判断和筛选的装置,其特征在于,包括:
获取及预处理模块,用于获取多条待判断的评论数据,对所述待判断的评论数据进行预处理;
情感分析模块,用于将每条所述预处理后的评论数据输入情感分析模型,输出评论情感得分;
主题分析模块,用于将每条所述预处理后的评论数据输入主题分析模型,输出词频权重和评论主题排序;
可信度分析模块,用于将每条所述预处理后的评论数据输入可信度分析模型,输出评论者可信度得分;
计算模块,用于根据所述评论情感得分、词频总权重、评论者可信度得分及在所述评论数据中提取的语义特征,进行加权求和,得到评论有用性得分;
筛选模块,用于将所述评论有用性得分与预设阈值相比较,判断和筛选出高效有用评论;
排序模块,用于根据阅读者的网络特征,并结合所述评论主题排序,输出基于阅读者特征的高效有用评论排序结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110496262.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种火山通道识别划分方法
- 下一篇:一种汽车轮毂