[发明专利]一种基于AI语义分析的群情报信息研判方法和系统在审
申请号: | 201911300148.6 | 申请日: | 2019-12-16 |
公开(公告)号: | CN112949314A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李达;杨毅 | 申请(专利权)人: | 武汉烽火众智数字技术有限责任公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06Q50/26 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 郑飞 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ai 语义 分析 群情 信息 研判 方法 系统 | ||
1.一种基于AI语义分析的群情报信息研判方法,其特征在于,包括:
获取并导入群情报信息;
利用词频-逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句;
利用余弦相似性算法对所述敏感词汇语句进行分析,对所述敏感词汇语句进行过滤;
对过滤后的敏感词汇语句进行判定,根据判定结果采取预防处置和归档操作。
2.如权利要求1所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,利用词频-逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句的方法为:
对所述敏感词汇语句进行分词;
剔除所述敏感词汇语句中的停用词;
采用词频-逆向文件频率算法对分词进行计算。
3.如权利要求2所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,所述词频-逆向文件频率算法公式为:
其中,tfij表示在敏感词汇文本中出现的频率,nij表示敏感词汇在自然语言文本中出现的次数,∑knkj表示自然语言文本中所有词汇出现的次数总和。
4.如权利要求1所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,所述预防处置和归档操作为:
根据敏感词汇语句,确定敏感词汇语句发布者身份信息;
根据发布者身份信息,进行事前核处;
产生非法事件预警;
进行事先处置和事后追处;
将所述过程进行归档。
5.如权利要求1所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,所述余弦相似性算法公式为:
其中,xi、yi分别表示句子x和y的词频向量。
6.如权利要求1所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,所述群警报信息为社交软件群聊天记录。
7.如权利要求1所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,当群情报信息为语音信息时,先将语音信息转换为文字信息。
8.如权利要求1所述的一种基于AI语义分析的群情报信息研判方法,其特征在于,所述敏感词汇可以进行模糊判定,将同一类型词汇判定为相同敏感词汇。
9.一种基于AI语义分析的群情报信息研判系统,其特征在于,包括:群情报信息获取模块、AI语义分析模块、语义判定模块、归档操作模块;
群情报信息获取模块,用于获取并导入群情报信息;
AI语义分析模块,用于利用词频-逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句;利用余弦相似性算法对所述敏感词汇语句进行分析,对所述敏感词汇语句进行过滤;
语义判定模块,对敏感词汇语句进行判定;
归档操作模块,根据敏感词汇语句判定结果,进行预防处置和归档操作。
10.如权利要求9所述的一种基于AI语义分析的群情报信息研判系统,其特征在于,所述AI语义分析模块包括词频-逆向文件频率算法模块和余弦相似性算法模块;
词频-逆向文件频率算法模块,用于利用词频-逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句;
余弦相似性算法模块,用于利用余弦相似性算法对所述敏感词汇语句进行分析,对所述敏感词汇语句进行过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火众智数字技术有限责任公司,未经武汉烽火众智数字技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911300148.6/1.html,转载请声明来源钻瓜专利网。