[发明专利]一种自动化特征提取系统及方法在审
| 申请号: | 202010302592.8 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111461253A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 王磊 | 申请(专利权)人: | 浙江百应科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 杭州浙言专利代理事务所(普通合伙) 33370 | 代理人: | 易朝晖 |
| 地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自动化 特征 提取 系统 方法 | ||
1.一种自动化特征提取框架系统,其特征在于,包括:
信号输入模块:用于输入字段信息;
配置读取模块:用于定义字段类型和对应的映射业务,配置对应的字段和特征方法;
预处理模块:用于对输入字段进行特征预处理;
特征抽取模块:用于对预处理后的数据进行特征抽取;
信号输出模块:用于联合抽取出的特征并统一输出给模型。
2.根据权利要求1所述的自动化特征提取框架系统,其特征在于,所述配置读取模块中抽象出的配置文件具体为fealib.conf和feature_list.conf。
3.根据权利要求2所述的自动化特征提取框架系统,其特征在于,所述配置文件fealib.conf用于定义上游日志中相关的字段类型和对应的映射业务;所述配置文件feature_list.conf用于配置对应的字段和特征方法。
4.根据权利要求3所述的自动化特征提取框架系统,其特征在于,经所述预处理模块中处理过的特征,通过java反射的方式定义到具体的特征工程类。
5.根据权利要求1所述的自动化特征提取框架系统,其特征在于,所述特征抽取模块中定义了对应好特征的slot槽位,能够支持同一个字段提取多个特征或多个字段联合生成同一个特征。
6.根据权利要求1所述的自动化特征提取框架系统,其特征在于,经所述特征抽取模块抽取后的特征通过输出接口联合成统一的样本instance输出给模型。
7.一种自动化特征提取框架方法,其特征在于,包括以下步骤:
S1:通过信号输入接口输入字段信息;
S2:通过配置找到对应的特征预处理方法;
S3:然再经具体的特征抽取类,抽取出对应的特征,进行相关的分桶加密;
S4:加密后的多个特征通过信号输出接口联合成统一的样本instance输出给模型。
8.根据权利要求7所述的自动化特征提取框架方法,其特征在于,所述字段信息能够同时经过多个特征预处理方法的处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010302592.8/1.html,转载请声明来源钻瓜专利网。





