[发明专利]案情数据的归并方法及装置在审
申请号: | 201810827109.0 | 申请日: | 2018-07-25 |
公开(公告)号: | CN109033351A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 钟翔宇;李士勇;张瑞飞;李广刚 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 归并 命中 数据分类 集合 案件 公安领域 模型确定 准确率 算法 维度 预设 分类 申请 | ||
本申请公开了案情数据的归并方法及装置,首先基于两种不同的算法,分别从已知案件类别的案情数据中获取第一动词集和第二动词集,并根据第一动词集和第二动词集生成与案件类别对应的特征动词集合,提高了获取特征动词的准确率;其次利用该特征动词集合训练获得案情数据分类模型,通过该案情数据分类模型确定待归并案情数据的命中类别,提高了模型对待归并案情数据的分类精度;最后根据命中类别预设的至少一个串并维度,将待归并案情数据和该命中类别中的已知案情数据进行串并,并根据串并结果进行数据归并,提高了公安领域案件串并工作的精度和效率,同时提高了海量案情数据的利用率。
技术领域
本申请涉及犯罪案情数据挖掘技术领域,尤其涉及一种案情数据的归并方法及装置。
背景技术
在刑事案件侦破技术领域,案件串并是串联案件和并案侦查的简称,案件串并分析不仅有利于打击多发性、连续性、区域性犯罪活动,遏制案件的多发态势,还能使执法人员对可能发生的犯罪活动进行预测,从而及时打击预防。
通常,案件串并首先要对案情数据进行分类,例如,盗窃类、抢劫类等,其次,再将同一案件类别的不同案情数据进行对比分析,执法人员凭借其办案经验来判断案件的相似程度,进而完成案件的串并侦查工作。
然而,由于执法机构常年积累的犯罪案情数据量巨大,且其中不乏一大部分内容有缺失、特征要素不明确的数据,这就使得针对任意一组案情数据,尤其是不完整的案情数据的串并分析,都需要消耗大量的时间,加之这些分析均是基于执法人员的经验进行,因此串并的准确率也无法得到保证。由此,大量的案件之间潜在的关联,难以得到挖掘,从而导致数据利用率低且办案效率低下的问题。
因此,如何提高对案情数据的串并精度和效率,尤其是对不完整的案情数据的串并,成为本领域技术人员亟待解决的技术问题。
发明内容
本申请提供一种案情数据的归并方法及装置,以提高对案情数据的串并精度和效率。
第一方面,本申请提供了一种案情数据的归并方法,该方法包括:
通过两种不同算法分别从已知案件类别的案情数据中,获取到第一动词集和第二动词集;
根据所述第一动词集和第二动词集,生成与案件类别对应的特征动词集合;
利用所述特征动词集合训练获得案情数据分类模型;
根据所述案情数据分类模型,获取待归并案情数据的命中类别;
根据所述命中类别预设的至少一个串并维度,将所述待归并案情数据和所述命中类别中的已知案情数据进行串并,并根据串并结果进行数据归并。
第二方面,本申请提供一种案情数据的归并装置,包括:
获取单元,用于通过两种不同算法分别从已知案件类别的案情数据中,获取到第一动词集和第二动词集;
生成单元,用于根据所述第一动词集和第二动词集,生成与案件类别对应的特征动词集合;
训练单元,用于利用所述特征动词集合训练获得案情数据分类模型;
分类单元,用于根据所述案情数据分类模型,获取待归并案情数据的命中类别;
归并单元,根据所述命中类别预设的至少一个串并维度,将所述待归并案情数据和所述命中类别中的已知案情数据进行串并,并根据串并结果进行数据归并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810827109.0/2.html,转载请声明来源钻瓜专利网。