[发明专利]一种数据流分类方法、装置及系统在审
| 申请号: | 201911183941.2 | 申请日: | 2019-11-27 |
| 公开(公告)号: | CN112861894A | 公开(公告)日: | 2021-05-28 |
| 发明(设计)人: | 赵礼菁;胡翔;杜静波;冯张潇 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张翠华 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据流 分类 方法 装置 系统 | ||
本申请公开了一种数据流分类方法、装置及系统,用以解决效率低的问题。针对数据流,先通过SA特征库进行分类,针对无法匹配的数据流通过分类模型来执行分类。分类模型训练时,通过SA特征库分类后能够确定类别的数据流,基于分类结果进行标签标注,然后用于训练模型。无需人工参与,可提高效率。另外,针对在分类模型训练和识别过程中获取用于识别得到分类结果的特征规则,并用于更新SA特征库,无需人工参与更新特征库,可进一步提高效率。
技术领域
本申请实施例涉及通信技术领域,尤其涉及一种数据流分类方法、装置及系统。
背景技术
随着近年来移动互联网的高速发展,AR/VR、4K高清视频等新应用不断涌现,带来了移动数据业务的爆发式增长。针对运营商来说迫切需要的是:进行基于业务内容的差异化计费。为了实现基于业务内容的差异化计费,主要是识别业务内容。目前采用业务感知(service awareness,SA)技术来识别业务内容。SA技术,是在分析包头的基础上,能够深度分析数据包所携带的4~7层协议的特征,是一种基于应用层信息检测和控制技术。SA采用SA特征库的方式进行识别,因此网元的识别能力需要依赖SA特征库的开发与升级,识别更新后的业务内容需要人工对特征库升级后才能够识别,并且在SA特征库升级之前无法获取到分类结果,导致效率较低。
发明内容
本申请实施例提供一种数据流分类方法、装置及系统,用以解决效率低的问题。
第一方面,本申请实施例提供一种数据流分类方法,包括:根据业务感知SA特征库对采集到的数据流进行分类得到采集到的数据流中的N个第一数据流分别所属的类别,并确定所述采集到的数据流中M个第二数据流与SA特征库中的特征规则不匹配,M和N为正整数;根据所述N个第一数据流分别所属的类别对所述N个第一数据流进行标签标注,并根据所述N个第一数据流以及所述N个第一数据流分别所标注的标签对待训练模型进行训练得到分类模型;根据所述分类模型对所述M个第二数据流进行分类得到所述M个第二数据流所属的类别。
上述方法,通过SA特征库对数据流分类后,采用识别确定类别的数据流训练模型,然后对于无法匹配的数据流采用训练后的分类模型进行识别,可以提高识别度,无需依赖特征库的开发与升级,可以提高效率。另外,无需人工的参与,即能够识别到升级后的数据流所属类别。此外,通过SA特征库的匹配结果对数据流进行标注,采用标注后的数据流训练模型,无需人工参与标注,能够提高效率。
在一种可能的设计中,还包括:获取所述N个第一数据流中每个第一数据流所包括的字段的重要度,以及获取所述M个第二数据流每个数据流所包括的字段的重要度,每个字段的重要度用于表征所述每个字段对所述每个字段所属的数据流的分类结果产生影响的重要程度;然后,根据所述N个第一数据流和所述M个第二数据流中每个数据流包括的字段的重要度和所述每个数据流所属的类别生成特征规则,所述特征规则用于更新所述SA特征库。
通过上述设计,在模型训练和识别过程中获取识别数据流所属类别的特征规则,用于更新SA特征库,无需人工参与升级SA特征库,进一步提高效率。
在一种可能的设计中,根据所述N个第一数据流和所述M个第二数据流中每个数据流包括的字段的重要度和所述每个数据流所属的类别生成特征规则,包括:
确定N个第一数据流中属于第一类别的至少一个第一数据流中包括的K1个特征字段,所述K1个特征字段中每个特征字段的重要度大于所述至少一个第一数据流包括的字段中除所述K1个特征字段以外的其它字段;确定M个第二数据流中属于第一类别的至少一个第二数据流中包括的K2个特征字段,所述K2个特征字段中每个特征字段的重要度大于所述至少一个第二数据流包括的字段中除所述K2个特征字段以外的其它字段;K1和K2为正整数;然后,根据所述K1个特征字段以及所述K2个特征字段生成所述第一类别对应的特征规则。
上述设计中,采用重要度较高的字段作为特征字段,提高识别的准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911183941.2/2.html,转载请声明来源钻瓜专利网。





