[发明专利]一种基于公安文本的主动发现案件关键词的方法在审
| 申请号: | 201911270464.3 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111160025A | 公开(公告)日: | 2020-05-15 |
| 发明(设计)人: | 朱沐尧;王全修;杨培文;吴培辛 | 申请(专利权)人: | 日照睿安信息科技有限公司;北京睿企信息科技有限公司;南京清月智能科技研发有限公司;上海清月人工智能科技有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/33;G06Q50/26 |
| 代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 范赤 |
| 地址: | 276827 山东省日照*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 公安 文本 主动 发现 案件 关键词 方法 | ||
1.一种基于公安文本的主动发现案件关键词的方法,其特征在于,包括如下步骤:
S1:对结构化公安文本直接提取数据,对非结构化公安文本进行数据预处理;
S2:使用基于主题模型的无监督关键词提取网络对预处理后的文本数据提取关键词;
S3:使用融合若干种因子的关键词热度分析模型对所述步骤S2中提取的关键词进行分析,进一步突出与当前事件或当前季节相关性更紧密的关键词;
S4:对所述步骤S3中的关键词进行实时热度分析与趋势热度分析,获取该关键词的当前实时热度并预测其后续热度发展趋势。
2.根据权利要求1所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,对于所述步骤S1,数据预处理的输入是结构化公安文本和经预处理后的非结构化公安文本,输出是包含文本语义、领域知识、刑侦研判因子的文本嵌入向量。
3.根据权利要求1所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,对于所述步骤S2,提取关键词的输入是公安文本,输出是被提取出的关键词。
4.根据权利要求3所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,用来抽取公安文本中关键词的方法为TF-IDF、 TextRank 算法和基于主题模型的无监督关键词提取网络。
5.根据权利要求3所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,被提取出的关键词融合了公安领域知识以及与上下文相关的语义信息。
6.根据权利要求1所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,对于所述步骤S3,所述融合若干种因子的关键词热度分析模型的输入是被提取出的融合了领域知识和文本语义的关键词,输出是融合了若干种因子后的关键词及其热度值。
7.根据权利要求6所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,所述若干种模型因子包括有历史趋势因子、事件驱动因子、季节趋势因子、波动率因子、影响衰减因子、关联信息影响因子。
8.根据权利要求1所述的一种基于公安文本的主动发现案件关键词的方法,其特征在于,对于所述步骤S4,输入是融合了若干种因子的关键词及其热度值,输出是对关键词的实时热度分析与趋势热度分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日照睿安信息科技有限公司;北京睿企信息科技有限公司;南京清月智能科技研发有限公司;上海清月人工智能科技有限公司,未经日照睿安信息科技有限公司;北京睿企信息科技有限公司;南京清月智能科技研发有限公司;上海清月人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911270464.3/1.html,转载请声明来源钻瓜专利网。





