[发明专利]一种基于多元数据分析的高校评价系统有效
申请号: | 201810029406.0 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108090048B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 钱付兰;乔嘉琪;赵姝 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F16/31;G06F16/35;G06Q10/06;G06Q50/20 |
代理公司: | 合肥市长远专利代理事务所(普通合伙) 34119 | 代理人: | 段晓微;叶美琴 |
地址: | 230000*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多元 数据 分析 高校 评价 系统 | ||
1.一种基于多元数据分析的高校评价系统,其特征在于,包括:
训练模型构建模块,用于通过人工标注的高校话题主题类别和评论情感倾向类别对预设话题数据和预设话题评论数据进行训练,得到训练模型;
数据获取模块,用于通过网络爬虫获取高校话题数据和高校话题评论数据;
话题主题分类模块,用于通过训练模型对高校话题数据进行话题主题识别,得到高校话题数据的话题主题类别;
评论情感分类模块,用于通过训练模型对高校话题评论数据进行评论情感识别,得到高校话题评论的情感类别;
标签生成模块,用于通过训练模型对高校话题数据进行标签识别,得到高校话题标签;
数据管理模块,用于对高校话题数据、高校话题评论数据、高校话题数据的话题主题类别、高校话题评论的情感类别、高校话题标签进行管理;
数据可视化模块,用于向用户展示高校话题数据的话题主题类别、高校话题评论的情感类别、高校话题标签;
所述训练模型包括话题主题训练模型、评论情感训练模型和标签训练模型;
所述话题主题训练模型,具体包括:
计算预设话题数据中的词在不同高校话题主题类别下的文档频率;
以高校话题主题类别作为特征向量的各维特征,该词在各高校话题主题类别下的文档频率值作为各维特征的权重值,构造词类别贡献度特征向量;
将预设话题数据的特征词和对应的词类别贡献度特征向量进行累加归一化,得到话题类别贡献度特征向量,所述话题类别贡献度特征向量为话题主题训练模型;
所述构造词类别贡献度特征向量,包括:
其中,m为高校话题主题类别,为词tj的类别贡献度特征向量,为词tj在m下的权重,其中为m中包含tj的文本数,nm为该高校话题主题类别下的文本总数;
所述预设话题数据的特征词,包括:
计算预设话题数据中各词的TF-IDF值;
计算预设话题数据中各词的最大化差异值;
将最大化差异值和TF-IDF值相乘计算各词的权值,将各词的权值降序排序,选择降序排序后前N个词作为预设话题数据的特征词,公式为:
wj为j词的权值,mDj为词tj的最大化差异值,其中a、b为m个高校话题主题类别中的任意2个类别,Zasj为高校话题主题类别a中词j出现s次的文本数据和该高校话题主题类别中包含词j的比例,Zbsj代表高校话题主题类别b中词j出现s次的文本数据和该高校话题主题类别中包含词j的比例;tfj为文档频率,idfj为逆文档频率。
2.根据权利要求1所述的基于多元数据分析的高校评价系统,其特征在于,所述训练模型构建模块,具体用于:
在通过人工标注的高校话题主题类别和评论情感倾向类别对预设话题数据进行训练之前,对预设话题数据和预设话题评论数据进行分词、去停用词和去噪,得到待处理话题数据和待处理话题评论数据;
人工标注高校话题主题类别、人工标注高校话题对应评论情感倾向类别,作为训练集。
3.根据权利要求1所述的基于多元数据分析的高校评价系统,其特征在于,所述话题主题分类模块,具体用于:
通过话题主题训练模型识别高校话题数据的最大维特征,得到高校话题数据的话题主题类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810029406.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置