[发明专利]一种平台留言文本挖掘方法及系统在审

专利信息
申请号: 202010597310.1 申请日: 2020-06-28
公开(公告)号: CN111930936A 公开(公告)日: 2020-11-13
发明(设计)人: 王红;庄鲁贺;韩书;李威;张慧 申请(专利权)人: 山东师范大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06N3/04;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李琳
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 平台 留言 文本 挖掘 方法 系统
【说明书】:

发明公开了一种平台留言文本挖掘方法及系统,包括对历史平台留言信息进行数据标记,得到对应的标记类别;根据历史平台留言信息和对应的标记类别训练构建的长短期记忆网络模型;以训练后的长短期记忆网络模型对待分类平台留言信息进行分类,得到待分类平台留言信息所属的标记类别;将任一标记类别下平台留言信息的留言编号和留言主题合并为合并列,对合并列进行聚类,得到当前标记类别下的留言类簇;根据留言类簇的热度得到当前标记类别下的热点留言类簇。针对网络问政平台中的用户留言数据,有利于及时发现热点问题,针对性处理、提升服务效率。

技术领域

本发明涉及数据分析挖掘技术领域,特别是涉及一种平台留言文本挖掘方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

近年来,随着阳光热线、微博、市长信箱、微信等网络问政平台逐渐成为了政府了解民意、汇聚民智慧、凝聚民气的重要渠道,各类社情民意的相关文本数据量在不断地攀升,已经给以往靠人工来对留言进行划分和对热点问题进行整理的工作带来了极大的挑战。同时,随着人工智能、大数据、云计算等技术的发展,建立基于自然语言处理技术的智慧政务系统已经是社会治理创新发展的新趋势,这对提升政府的管理水平和市政效率具有极大地推动作用。

数据挖掘是一种在大型数据存储库中自动发现有用信息的过程,一般包括数据预处理、数据挖掘和后处理几部分。目前相关领域关于数据挖掘的应用非常多,但是,根据以往群众留言和政府答复的特征,挖掘群众留言和评价政府答复的相关方法尚未有成熟的结果和说明。

随着各类反映社情民意的相关文本数据量急剧增加和人们生活步伐的越来越快,政府的市政效率也要进行大幅提升。针对各类问政平台汇集的留言信息,传统的方法是用人工对每条留言进行判断应该把该条留言交给哪个部门进行回复,随着人们对办事效率的要求越来越高和留言数据量的急剧增加,传统的人工分类方法已经不能满足当代的需求了;除此之外,留言划分完成后,某一时段内反映特定地点或特定人群的问题称为热点问题,部门首先要解决的是热点问题,因为热点问题往往是急需得到解决或者比较严重的问题,因此需要对热点问题进行提取;针对热点问题的提取工作,如果用数据挖掘的方法来替代传统的人工处理,那么效率也会得到大大提升。综上所述,利用数据挖掘技术,对群众留言进行划分且对热点留言进行挖掘,尚缺乏有效的解决方案。

发明内容

为了解决上述问题,本发明提出了一种平台留言文本挖掘方法及系统,针对网络问政平台中的用户留言数据,对其进行数据标记,得到对应的标记类别,根据分类模型对留言信息进行分类,根据所属类别进行聚类,根据留言类簇的热度挖掘热点留言;有利于及时发现热点问题,针对性处理、提升服务效率。

为了实现上述目的,本发明采用如下技术方案:

第一方面,本发明提供一种平台留言文本挖掘方法,包括:

对获取的历史平台留言信息进行数据标记,得到对应的标记类别;

根据历史平台留言信息和对应的标记类别训练构建的长短期记忆网络模型;

以训练后的长短期记忆网络模型对待分类平台留言信息进行分类,得到待分类平台留言信息所属的标记类别;

将任一标记类别下平台留言信息的留言编号和留言主题合并为合并列,对合并列进行聚类,得到当前标记类别下的留言类簇,根据留言类簇的热度得到当前标记类别下的热点留言类簇对应的热点平台留言信息。

第二方面,本发明提供一种平台留言文本挖掘系统,包括:

标记模块,用于对获取的历史平台留言信息进行数据标记,得到对应的标记类别;

训练模块,用于根据历史平台留言信息和对应的标记类别训练构建的长短期记忆网络模型;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010597310.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top