[发明专利]一种基于百度贴吧的网民学业情绪分析方法在审

专利信息
申请号: 201810233206.7 申请日: 2018-03-21
公开(公告)号: CN108363699A 公开(公告)日: 2018-08-03
发明(设计)人: 金苍宏;方格格;赵品通;吴明晖;刘泽民;朱凡微;袁伟 申请(专利权)人: 浙江大学城市学院
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 浙江杭州金通专利事务所有限公司 33100 代理人: 刘晓春
地址: 310015 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于百度贴吧的网民学业情绪分析方法,包括:数据采集和提取;采集百度贴吧中高考吧主题帖子,形成数据集;数据预处理;首先,去除数据集中的帖子内容中的非文本信息;其次,进行中文分词,对帖子文本中的词汇进行词性分析,去除相关的停用词;学业情绪分类;对数据预处理后的数据集按照13类学业情绪进行学业情绪标注,学业情绪标注包括人工标注机器学习和机器标注;对学业情绪分类结果进行相关性与差异性分析。本发明运用学业情绪人工分类和采用机器学习方法对数据集进行情绪分类,判断整体情绪,并统计各情绪强度和占比,最后根据时间序列、情绪拐点和关键事件、学业情绪的群体特征等多个方面,对高考事件中网民的学业情绪的时间发展特征和群体特征进行多角度分析。
搜索关键词: 情绪 数据集 网民 标注 数据预处理 机器学习 情绪分析 群体特征 去除 高考 差异性分析 多角度分析 非文本信息 词性分析 多个方面 分类结果 关键事件 人工标注 人工分类 时间发展 时间序列 数据采集 数据集中 帖子内容 整体情绪 中文分词 主题帖子 停用词 分类 帖子 拐点 词汇 文本 采集 统计
【主权项】:
1.一种基于百度贴吧的网民学业情绪分析方法,其特征在于,所述分析方法包括以下步骤:步骤1、数据采集和提取;采集百度贴吧中高考吧主题帖子,形成数据集;步骤2、数据预处理;首先,去除所述数据集中的帖子内容中的非文本信息;其次,进行中文分词,对帖子文本中的词汇进行词性分析,去除相关的停用词;步骤3、学业情绪分类;对数据预处理后的数据集按照13类学业情绪进行学业情绪标注,所述学业情绪标注包括人工标注机器学习和机器标注;步骤4、对学业情绪分类结果进行相关性与差异性分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学城市学院,未经浙江大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810233206.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top