[发明专利]一种模型训练方法、业务识别方法、装置和电子装置有效
申请号: | 202010089667.9 | 申请日: | 2020-02-12 |
公开(公告)号: | CN111355628B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 王敏;程涛木;陈鑫;王可锋;刘怡;吴艾伦;王京辉 | 申请(专利权)人: | 博瑞得科技有限公司 |
主分类号: | H04L67/06 | 分类号: | H04L67/06;H04L43/028;H04L43/04 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 钟连发 |
地址: | 401120 重庆市渝*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 业务 识别 装置 电子 | ||
一种模型训练方法、业务识别方法、装置和电子装置,可基于获取的目标应用程序列表从软件下载平台下载目标应用程序并安装;模拟人对目标应用程序的操作,对操作过程中产生的码流进行抓取得到pcap文件;并基于pcap文件得到带有业务类型的标签的模型训练数据,以该数据训练业务识别模型,该模型通过该训练能够学习到基于模型训练数据与业务类型之间的关系,而pcap文件是对模拟人的操作产生的码流进行抓包得到的,再加上被模拟的操作是已知的,而pcap文件中包含有反映人在应用界面的操作的信息,所以上述模型具体学习了人在应用界面操作的业务类型与操作产生的pcap文件的关系,也即本发明的模型具有对应用程序内用户行为的识别效果。
技术领域
本申请涉及计算机技术领域,尤其涉及一种模型训练方法、业务识别方法、装置和电子装置。
背景技术
传统的流量分析都是基于传输层的端口号来区分不同业务的,通过识别这些端口号对业务流量进行分类和统计。然而,随着人们对移动互联网内容需求的急速增长,基于HTTP和P2P的小众业务占据了移动数据网络的绝大多数流量,基于端口号的业务识别技术无法有效识别这些小众业务。
深度分组检测(deep packet inspection,DPI)技术是在传统的基于IP五元组(源IP地址、源端口号、目的地IP地址、目的地端口号和承载协议)的业务识别的基础上,对数据应用层进行进一步探测。采用DPI技术识别数据流业务,需建立流量特征库,基于流量特征库将数据识别为对应的业务。
目前,基于DPI的业务识别技术无法对应用内容深度解析,这里的对应用内容深度解析即是指对应用内用户行为的识别。基于DPI的业务识别技术只能解析到应用的小类,知道用户在某个时间点使用了某款app,也能知道app的具体名和版本号这些信息,但是用户在app里操作了什么内容,产生了哪些具体行为,现有的技术是无法识别出的,这也是DPI解析技术本身的局限性所在。
发明内容
本申请实施例提供一种模型训练方法、业务识别方法、装置和电子装置,可提升对应用内用户行为的识别。
本申请实施例第一方面提供一种模型训练方法,该方法包括:
获取目标应用程序列表,根据所述目标应用程序列表中的信息从软件下载平台自动下载目标应用程序;
安装下载的所述目标应用程序;
模拟人对所述目标应用程序的操作,对在所述操作的过程中产生的码流进行抓取,得到pcap文件,其中,所述pcap文件中包含所述目标应用程序的名称;
基于所述pcap文件得到带有标签的模型训练数据,以所述模型训练数据训练预设的业务识别模型,得到训练完成的业务识别模型,其中,所述模型训练数据的标签为所述pcap文件对应的所述操作的业务类型。
本申请实施例第二方面提供一种业务识别方法,该方法基于本申请实施例第一方面中训练完成的业务识别模型实现,该业务识别方法包括:
若检测到用户对应用程序的操作,则对所述操作产生的码流进行抓取,得到所述应用程序的待使用pcap文件,其中,所述待使用pcap文件中包含所述应用程序的名称;
基于所述待使用pcap文件得到所述业务识别模型的待识别数据,基于所述业务识别模型对所述待识别数据进行识别;
基于所述业务识别模型的识别结果确定所述应用程序的操作对应的业务类型。
本申请实施例第三方面提供一种模型训练装置,该装置包括:
自动获取模块,用于获取目标应用程序列表,根据所述目标应用程序列表中的信息从软件下载平台自动下载目标应用程序;
自动安装模块,用于安装下载的所述目标应用程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博瑞得科技有限公司,未经博瑞得科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010089667.9/2.html,转载请声明来源钻瓜专利网。