[发明专利]一种基于手机短信的行为分析方法和装置在审
| 申请号: | 202211501760.1 | 申请日: | 2022-11-28 |
| 公开(公告)号: | CN115983248A | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 曹荣鑫;陈志明;苏步发;陈明辉;邱宗炽;陈绍东;邓妹姑;方倩 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216;G06N3/08;G06N3/0464 |
| 代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郭涵炜 |
| 地址: | 361000 福建省厦门市思明*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 手机短信 行为 分析 方法 装置 | ||
1.一种基于手机短信的行为分析方法,其特征在于,包括以下步骤:
S1:提取手机短信信息;
S2:将所述手机短信信息分别进行关键词比对、规则比对、短信行为分析模型分析,得到对应分析结果;
S3:将所述分析结果融合汇聚,得到融合汇聚后的结果,输出短信行为分析刻画结果;
其中,短信行为分析模型包括:行为意图识别及关键要素提取。
2.根据权利要求1所述的一种基于手机短信的行为分析方法,其特征在于,所述的行为意图识别具体步骤为:
S201:对短信数据进行人工标注,根据不同短信内容将其分别归到不同类别;
S202:通过分层抽样的方法,按8:1:1区将数据分训练集、验证集和测试集;
S203:对所述训练集进行去重处理得到词汇表,即根据词汇表的大小随机初始化映射矩阵Wmn,其中m为词汇表的大小,n为词向量的维度;
S204:通过查询Wmn,得到训练样本的向量表示Wi,其中i表示第i个样本;
S205:对Wi进行卷积操作,得到卷积结果fcnn(wi;θcnn);
S206:对所述卷积结果fcnn(wi;θcnn)进行全局特征提取。
3.根据权利要求2所述的一种基于手机短信的行为分析方法,其特征在于,所述对不同fcnn(wi;θcnn)的卷积结果进行全局特征提取,具体为:采用最大池化提取全局特征,得到短信文本内容的特征表示xp:
xp=fGMP(fcnn(wi;θcnn))∈RD
其中θcnn表示模型参数,D为设定的特征维度;
再将xp进行softmax层作用得到最大得分的类别标签L,其中L计算公式如下:
L=argmaxsoftmax(xp)。
4.根据权利要求1所述的一种基于手机短信的行为分析方法,其特征在于,所述的关键要素提取具体步骤为:
S211:对短信数据进行人工标注,将时间、地点、金额、应用名称内容的起始位置进行标签标注;
S212:通过分层抽样的方法,按8:1:1区将数据分训练集、验证集和测试集;
S213:通过训练集进行去重处理得到词汇表,即根据词汇表的大小随机初始化映射矩阵Wab,其中a为词汇表的大小,b为词向量的维度;
S214:通过查询Wab,得到训练样本的向量表示WI,其中I表示第I个样本;
S215:对WI进行RNN操作,得到特征提取结果frab(wI;θrab)。
5.据权利要求4所述的一种基于手机短信的行为分析方法,其特征在于,所述对WI进行RNN操作,得到特征提取结果frab(wI;θrab),具体为:采用双向特征提取,将提取结果进行拼接,将特征提取结果进行softmax到最大得分的类别标签Q,
Q=argmaxsoftmax(frab(wI;θrab)),其中θrab表示模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211501760.1/1.html,转载请声明来源钻瓜专利网。





