[发明专利]一种自动化特征提取系统及方法在审
| 申请号: | 202010302592.8 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111461253A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 王磊 | 申请(专利权)人: | 浙江百应科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 杭州浙言专利代理事务所(普通合伙) 33370 | 代理人: | 易朝晖 |
| 地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自动化 特征 提取 系统 方法 | ||
本发明涉及一种自动化特征提取框架系统及方法,包括:信号输入模块:用于输入字段信息;配置读取模块:用于定义字段类型和对应的映射业务,配置对应的字段和特征方法;预处理模块:用于对输入字段进行特征预处理;特征抽取模块:用于对预处理后的数据进行特征抽取;信号输出模块:用于联合抽取出的特征并统一输出给模型;本发明提供一种基于工厂模式的自动化特征提取方法,在整个实现的过程中提供了一种多人协作共建特征提取类和相互交互复用的方法;本发明采用工厂模式和相关特征类的反射机制抽象了特征提取的各个模块和方法,完全自动化特征提取,可以方便的通过配置进行特征的选择和迭代。
技术领域
本发明涉及互联网技术领域,具体涉及一种自动化特征提取框架系统及方法。
背景技术
随着大数据和机器计算力的飞速发展,机器学习和深度学习越来越多的运用到解决实际问题的各个方面。
在专利公布号为CN108986168的发明专利中公开了一种,本发明公开一种基于深度度量学习结合词袋树模型的机器人回环检测方法和装置。该方法为:1 )输入长时间的环境外观变化的场景视频流;2 )采用深度度量学习框架训练并学习得到特征提取网络;3 )利用特征提取网络从训练视频流图像中抽取特征;4 )对得到的特征进行迭代聚类,建立词袋树模型;5 )在实际机器人定位和导航过程中,输入机器人实时获取的视频流中的当前关键帧;6 )利用特征提取网络提取当前关键帧的特征;7 )将当前关键帧的特征添加到词袋树模型;8 )利用词袋树模型搜索和匹配图像特征相近的图像帧,并进行相似性度量,判断机器人是否遇到回环。本发明能够实现机器人在动态环境中长时间定位和导航过程中的高效的回环检测。
在上述现有技术中,没有提供一个完全自动化的实时特征提取框架,且基本各个环节都或多或少的需要人的参与,不能满足多个人完全自然的积累特征抽取类,提供相关的实现方法,且每次迭代在特征抽取方法和具体的参数上不能复用。
发明内容
为了解决上述问题,本发明提供一种自动化特征提取框架系统及方法,采用工厂模式和相关特征类的反射机制抽象了特征提取的各个模块和方法,完全自动化特征提取,可以方便的通过配置进行特征的选择和迭代,算法多次迭代选择特征训练测试模型时,可以通过配置修改一键完成,避免出现多次选择特征复用不够的情况。
本发明的技术方案如下所示:
一种自动化特征提取框架系统,包括:
信号输入模块:用于输入字段信息;
配置读取模块:用于定义字段类型和对应的映射业务,配置对应的字段和特征方法;
预处理模块:用于对输入字段进行特征预处理;
特征抽取模块:用于对预处理后的数据进行特征抽取;
信号输出模块:用于联合抽取出的特征并统一输出给模型。
优选的,所述配置读取模块中抽象出的配置文件具体为fealib.conf和feature_list.conf。
优选的,所述配置文件fealib.conf用于定义上游日志中相关的字段类型和对应的映射业务;所述配置文件feature_list.conf用于配置对应的字段和特征方法。
优选的,经所述预处理模块中处理过的特征,通过java反射的方式定义到具体的特征工程类。
优选的,所述特征抽取模块中定义了对应好特征的slot槽位,能够支持同一个字段提取多个特征或多个字段联合生成同一个特征。
优选的,经所述特征抽取模块抽取后的特征通过输出接口联合成统一的样本instance输出给模型。
本发明还提供一种自动化特征提取框架方法,包括以下步骤:
S1:通过信号输入接口输入字段信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010302592.8/2.html,转载请声明来源钻瓜专利网。





