[发明专利]一种市长热线热点诉求话题检测方法和装置在审

专利信息
申请号: 202011405266.6 申请日: 2020-12-05
公开(公告)号: CN112560445A 公开(公告)日: 2021-03-26
发明(设计)人: 杨勇;洪学海 申请(专利权)人: 上饶市中科院云计算中心大数据研究院
主分类号: G06F40/216 分类号: G06F40/216;G06F40/289;G06K9/62;G06Q50/26
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 张勋
地址: 334000 江西*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 市长 热线 热点 诉求 话题 检测 方法 装置
【说明书】:

本申请实施例公开了一种市长热线热点诉求话题检测方法和装置,其中方法包括步骤:通过正则校验去除文本中的非中文字符,然后对文本进行分词;对诉求进行话题聚类,检测出诉求中的热点话题;挖掘所有诉求话题热词,并定期更新话题热词;计算话题的热度值,并定期更新话题的热度值。本申请实施例提供的方法和装置实现了自动检测市长热线中热度诉求话题,通过定时计算话题的热度值,实现了话题的后续追踪。

技术领域

本申请涉及人工智能技术领域,尤其涉及一种市长热线热点诉求话题检测方法和装置。

背景技术

随着互联网技术的高速发展,市长热线作为建立在群众一线的政府机构,是联结政府和人民群众的重要纽带。但是,随着市长热线的广泛运用,每天都有成千上万的诉求需要处理,目前,都是通过人工筛选过滤的模式对诉求进行处理,这种方法显然难以在短时间内收集当前的热点诉求。如何在政务大数据支撑下,利用政务大数据和人工智能技术,建立政务大数据集,并从数据集中挖掘诉求中热点诉求,并追踪诉求的后续发展,从而提高政府决策的前瞻性。目前市长热线主要存在以下几个方面的问题。第一,采用人工方式处理系统中的诉求,效率低。第二,不能实现对诉求话题的关注和后续追踪。

发明内容

本申请的目的在于提供一种市长热线热点诉求话题检测方法和装置,该方法实现了自动检测市长热线中热度诉求话题,通过定时计算话题的热度值,实现了话题的后续追踪。

第一方面,本申请实施例提供的一种市长热线热点诉求话题检测方法,包括步骤:通过正则校验去除文本中的非中文字符,然后对文本进行分词;对诉求进行话题聚类,检测出诉求中的热点话题;挖掘所有诉求话题热词,并定期更新话题热词;计算话题的热度值,并定期更新话题的热度值,实现对诉求话题的追踪。

一个可选的实施例中,所述通过正则校验去除文本中的非中文字符,然后对文本进行分词包括:通过正则表达式去除诉求文本数据中的非中文字符,包括但不限于:标点符号,表情符、数字、英文;通过“结巴”分词工具对文本数据分词,在分词的过程中需要构建停用词表和自定义字典,停用词表去除诉求文本数据中一些无意义的词。

一个可选的实施例中,通过潜在狄利克雷分布模型对诉求进行话题聚类,具体包括:从狄利克雷分布α中取样生成诉求文档i的主题分布θ(i),通过α得到文档i的主题分布;从主题的多项式分布θ(i)中取样生成诉求文档i第j个词的主题z(i,j),从主题分布中得到词的主题;从狄利克雷分布β中取样生成主题 z(i,j)的词语分布φz(i,j)得到所述主题的词分布;从词语的多项式分布φz(i,j)中采样最终生成词语w(i,j)根据所述的词分布得到词。

一个可选的实施例中,通过TF-IDF算法挖掘所有诉求话题热词,并按照所述热词的权重,选出权重最高的50个热词作为诉求的热词,并保存所述热词的权重,通过词云的方式展示。

一个可选的实施例中,通过如下公式计算话题的热度值:

其中,hotinit表示话题的初始热度,α*(n-1)表示话题诉求数量部分,其中α诉求数量影响因子,n话题中诉求的数量,表示热度随时间衰减,δ表示时间控制因子,t1表示当前时间,t0表示事件产生时间,单位为小时。

第二方面,本申请实施例还公开了一种装置,包括:

分词单元,用于通过正则校验去除文本中的非中文字符,然后对文本进行分词;

聚类单元,用于对诉求进行话题聚类,检测出诉求中的热点话题;

热词单元,用于挖掘所有诉求话题热词,并定期更新话题热词;

热度计算单元,用于计算话题的热度值,并定期更新话题的热度值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上饶市中科院云计算中心大数据研究院,未经上饶市中科院云计算中心大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011405266.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top