[发明专利]样本增强方法、模型训练方法及系统在审
| 申请号: | 202110646519.7 | 申请日: | 2021-06-10 |
| 公开(公告)号: | CN113420799A | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 王士波;陈露;吴永文;甘雪琴;郑欢欢;胡益炯;宋菲 | 申请(专利权)人: | 北京宜能高科科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F30/27 |
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 刘伟 |
| 地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本 增强 方法 模型 训练 系统 | ||
1.一种样本增强方法,其特征在于,包括:
将变量划分为独立变量、部分关联变量和剩余关联变量;
根据历史生产数据中每种变量对应的历史数据,获取每种变量对应的历史数据分布范围;
在每个独立变量对应的分布范围内随机生成多个随机数据,根据独立变量对应的随机数据计算出部分关联变量对应的中间数据,然后采用预先训练完成的简化模型以随机数据和中间数据作为输入计算并判断计算结果是否收敛,并在收敛时获取剩余关联变量对应的剩余数据;
将随机数据、中间数据和剩余数据整理合并成作为后续模拟的输入数据;
采用欧式距离对输入数据进行聚类得到多组子样本集,所述子样本集中包括多个样本,并对每组所述子样本集中的样本进行排序;
通过预先训练完成的严格机理模型,对每个子样本集中样本按照顺序进行分步模拟计算,得到样本的输出数据;
汇总并合并各样本的输入数据和对应的输出数据,得到通过样本增强获取的多个完整样本数据;
对获取的多个样本数据的分布范围进行可视化分析,并对稀疏区域的样本进行补充。
2.根据权利要求1所述的方法,其特征在于,根据历史生产数据中每种变量对应的历史数据,获取每种变量对应的历史数据分布范围的方法包括:
统计历史生产数据中每种变量对应的历史数据的上下限,并将上下限的范围作为对应变量的历史数据分布范围。
3.根据权利要求1所述的方法,其特征在于,在每个独立变量对应的分布范围内随机生成多个随机数据的方法包括:
基于每个独立变量对应的读取数据分布范围均匀的随机生成多个随机数据。
4.根据权利要求3所述的方法,其特征在于,根据独立变量对应的随机数据计算出部分关联变量对应的中间数据的方法包括:
基于每个独立变量对应的随机数据,采用相关性分析方法分析历史生产数据中的部分关联变量与独立变量间数据的相关性,获取部分关联变量与独立变量的两两相互影响关系,得到部分关联变量与独立变量的关系式;
根据关系式,将独立变量的随机数据作为输入计算对应部分关联变量的中间数据;
将属于同一组的部分关联变量的中间数据与独立变量的随机数据合并共同作为同一组的输入数据。
5.根据权利要求4所述的方法,其特征在于,采用预先训练完成的简化模型以随机数据和中间数据作为输入计算并判断计算结果是否收敛,并在收敛时获取剩余关联变量对应的剩余数据的方法包括:
采用预先训练的简化模型对包括随机数据和中间数据的输入数据进行模拟,若模拟结果为收敛则认为该组输入数据为有效样本数据,并将模拟结果作为剩余关联变量对应的剩余数据,若模拟结果为不收敛则认为该组输入数据为无效样本数据,则对输入数据进行剔除;
将属于同一组的剩余关联变量对应的剩余数据与部分关联变量以及独立变量的输入数据合并共同作为严格机理模型的同一组的输入数据。
6.根据权利要求5所述的方法,其特征在于,通过预先训练完成的严格机理模型,对每个子样本集中的样本按照顺序进行分步模拟计算得到输出数据的方法包括:
将子样本集分配给不同模拟节点,每个模拟节点采用相同的预先训练完成的严格机理模型对输入数据进行计算,每个模拟节点按照接收样本集中的样本顺序,对样本输入数据进行计算并判断输出结果是否收敛;
若收敛则将输出数据保存于第一收敛样本中,若未收敛则对相应的输入数据进行改造调整后重新输入严格机理模型,并将收敛的输出数据保存于第二收敛样本中;
将第一收敛样本与第二收敛样本合并得到剩余仪表对应的输出数据;
其中,若收敛则将输出数据保存于第一收敛样本之后还包括:对样本数据进行能量平衡验证,若验证结果为能量平衡则确认为收敛将输出数据保存于第一收敛样本中,若验证结果为能量不平衡则所述输出数据视为未收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宜能高科科技有限公司,未经北京宜能高科科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110646519.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新一代堵漏注浆材料
- 下一篇:氧化脱氢制取丁二烯热回收系统及其使用方法





