[发明专利]一种基于手机短信的行为分析方法和装置在审
| 申请号: | 202211501760.1 | 申请日: | 2022-11-28 |
| 公开(公告)号: | CN115983248A | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 曹荣鑫;陈志明;苏步发;陈明辉;邱宗炽;陈绍东;邓妹姑;方倩 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216;G06N3/08;G06N3/0464 |
| 代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郭涵炜 |
| 地址: | 361000 福建省厦门市思明*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 手机短信 行为 分析 方法 装置 | ||
本发明给出了一种基于手机短信的行为分析方法,包括提取手机短信信息;对提取的短信数据进行人工标注,并根据不同短信内容将其归到不同类别;通过分层抽样的方法,按8:1:1区将数据分训练集、验证集和测试集;通过关键词比对、正则表达式、行为意图识别及关键要素提取进行处理,得到分析结果;将分析结果融合汇聚,输出用户的相关行为的刻画分析。在传统内容关键词比对、正则表达式分析基础上,利用人工智能文本语义分析技术及相关方法,面对海量的数据,全面深入智能分析短信内容,不用人工翻阅统计,刻画目标对象短信行为事件,为用户第一时间发现线索、固定证据、分析研判提供高效的技术手段。
技术领域
本发明涉及信息技术领域,尤其是一种基于手机短信的行为分析方法和装置。
背景技术
随着互联网及技术的发展,智能手机存储空间越来越大,手机上存储信息也越来越多。从手机上提取的一些信息,比如短信、通话记录、聊天记录等,对于案件侦破起到至关重要的作用。
目前基层单位,对手机进行调查取证时,通过手机取证设备提取手机短信信息,并对删除短信进行删除恢复,尽可能还原手机用户短信行为事件。在现有的手机取证产品中,针对手机短信内容,缺乏深入分析手段,提取后的短信一般以发送或接收时间顺序进行展示,并通过正则表达式或关键词比对,提取资金流水或身份账号信息,如手机号码、身份证号等。
随着智能手机存储空间逐步增大,短信信息一般情况下都保存手机上,随着时间累积,短信信息量逐步增大,通过传统手机取证设备提取后,没有对短信内容进行深入分析,通过一线工作人员逐条浏览,无法及时发现有价值的线索,导致线索发现难,调查取证不及时,案件侦办效率低等问题发生。
发明内容
本发明提出了一种基于手机短信的行为分析方法和装置。
在一个方面,本发明提出了一种基于手机短信的行为分析方法,包括以下步骤:
S1:提取手机短信信息;
S2:将S1中提取的手机短信信息分别进行关键词比对、规则比对、短信行为分析模型分析,得到分析结果;
S3:将S2中得到的分析结果融合汇聚,得到融合汇聚后的结果,输出短信行为分析刻画结果;
其中,短信行为分析模型包括:行为意图识别及关键要素提取。
通过以上技术方案,在传统内容关键词比对、正则表达式分析基础上,利用人工智能文本语义分析技术及相关方法,即使面对海量的数据,也能全面深入智能分析短信内容,为基层工作人员第一时间发现线索、固定证据、分析研判提供高效的技术手段。
在具体的实施例中,行为意图识别具体步骤为:
S201:对短信数据进行人工标注,根据不同短信内容将其分别归到不同类别;
S202:通过分层抽样的方法,按8:1:1区将数据分训练集、验证集和测试集;
S203:通过训练集进行去重处理得到词汇表,即根据词汇表的大小随机初始化映射矩阵Wmn,其中m为词汇表的大小,n为词向量的维度,该矩阵伴随训练过程进行优化;
S204:通过查询Wmn,得到训练样本的向量表示Wi,其中i表示第i个样本。
S205:对Wi进行卷积操作,得到卷积结果fcnn(wi;θcnn);
S206:对fcnn(wi;θcnn)的卷积结果进行全局特征提取。
在具体的实施例中,所述的关键要素提取具体步骤为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211501760.1/2.html,转载请声明来源钻瓜专利网。





