[发明专利]一种基于情感倾向分析的文章评估方法和系统在审
申请号: | 201710367254.0 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107301200A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 周钰徐 | 申请(专利权)人: | 合肥智权信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 合肥市长远专利代理事务所(普通合伙)34119 | 代理人: | 段晓微,叶美琴 |
地址: | 230000 安徽省合肥市高新区国家大学*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 倾向 分析 文章 评估 方法 系统 | ||
技术领域
本发明涉及信息资源技术领域,尤其涉及一种基于情感倾向分析的文章评估方法和系统。
背景技术
随着科学技术和互联网技术的不断发展,目前的互联网信息已经处于一种不规则增长态势之中,互联网已成为全球最大的信息资源库,它在给人类的生活和工作带来革命性变化的同时,也引发了“信息泛滥”“信息迷航”等问题,随着使用互联网的人员增加,大家在作为信息使用者的同时也成为了信息的生产者,那么,如何整理、挖掘、组织出高质量的且用户需要的信息是互联网发展当前需要解决的问题。
由于互联网具有高度互动性、匿名性、便利性、时效性和开放性特征,越来越多的信息使用者在使用信息之后会通过在线评价系统发表自己对文章、数据信息、网页的评价,表达自己阅读使用情况以及各方面情感体会,而这些阅读使用情况和情感体会往往会体现这些数据信息的质量,这些价和使用时的心得,很大程度上影响了其他使用者是否阅读和使用这些数据信息。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于情感倾向分析的文章评估方法和系统;
本发明提出的一种基于情感倾向分析的文章评估方法,包括:
S1、利用爬虫抓取、弹幕识别和语音识别获取目标文章评价数据;
S2、提取目标文章评价数据中的情感倾向特征,得到目标文章的评价词条集;
S3、根据预设评价词条的权值计算目标文章的评价词条集加权总分,得到目标文章推荐分;
S4、可视化展示目标文章的评价词条集和目标文章推荐分。
优选地,在步骤S2中,所述情感倾向特征词,包括:情感词、评价词和程度词;
优选地,所述情感词包括正面情感词和负面情感词;所述评价词包括正面评价词和负面评价词。
优选地,在步骤S2中,提取目标文章评价数据中的情感倾向特征词之前,还包括:建立情感词词典、评价词词典、程度词词典。
优选地,步骤S2,具体包括:
通过特征提取或关键词抽取,提取目标文章评价数据中的情感倾向特征;
通过向量空间模型将情感倾向特征向量化;
计算情感倾向特征之间的相似度,并选择合适算法进行聚类,得到目标文章的评价词条集。
优选地,步骤S4,具体包括:通过柱状图、雷达图、曲线图中一种或多种形式展示目标文章的评价词条集和目标文章推荐分。
一种基于情感倾向分析的文章评估系统,包括:
数据获取模块,用于利用爬虫抓取、弹幕识别和语音识别获取目标文章评价数据;
特征提取模块,用于提取目标文章评价数据中的情感倾向特征,得到目标文章的评价词条集;
推荐分生成模块,用于根据预设评价词条的权值计算目标文章的评价词条集加权总分,得到目标文章推荐分;
展示模块,用于可视化展示目标文章的评价词条集和目标文章推荐分。
优选地,所述数据获取模块,具体用于:所述情感倾向特征词包括:情感词、评价词和程度词;
优选地,所述情感词包括正面情感词和负面情感词;所述评价词包括正面评价词和负面评价词。
优选地,还包括词典建立模块,与特征提取模块连接,用于在提取目标文章评价数据中的情感倾向特征之前,建立情感词词典、评价词词典、程度词词典。
优选地,所述特征提取模块,具体用于:
通过特征提取或关键词抽取,提取目标文章评价数据中的情感倾向特征;
通过向量空间模型将情感倾向特征向量化;
计算情感倾向特征之间的相似度,并选择合适算法进行聚类,得到目标文章的评价词条集。
优选地,所述展示模块,具体用于:通过柱状图、雷达图、曲线图中一种或多种形式展示目标文章的评价词条集和目标文章推荐分。
本发明通过获取目标文章评价数据,提取目标文章评价数据中的情感倾向特征,得到目标文章的评价词条集,根据预设评价词条的权值计算目标文章的评价词条集加权总分,得到目标文章推荐分,向用户可视化展示目标文章的评价词条集和目标文章推荐分,如此,通过提取基于自然语言的用户对文章评论中的情感倾向特征,得到对目标文章的评价词条集,客观的体现了目标文章的质量,给其他用户提供阅读及使用指导方面的参考价值,通过柱状图、雷达图、曲线图的形式展示目标文章的评价词条集和目标文章推荐分,方便用户从海量的文章及文章评价中更快地找到符合自己条件的文章及文章评价,节省用户的时间,提高检索效率,方便用户快速做出阅读使用决策,提升用户的用户体验。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥智权信息科技有限公司,未经合肥智权信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710367254.0/2.html,转载请声明来源钻瓜专利网。