[发明专利]基于视觉化分析的凭证信息遗漏填补方法有效
| 申请号: | 202211089881.X | 申请日: | 2022-09-07 |
| 公开(公告)号: | CN115169284B | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 马海;徐高德;李耿;谢继雷 | 申请(专利权)人: | 浙江爱信诺航天信息技术有限公司 |
| 主分类号: | G06F40/106 | 分类号: | G06F40/106;G06F40/166;G06F40/174 |
| 代理公司: | 杭州中港知识产权代理有限公司 33353 | 代理人: | 施建勇 |
| 地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视觉 化分 凭证 信息 遗漏 填补 方法 | ||
1.基于视觉化分析的凭证信息遗漏填补方法,其特征在于,包括以下步骤:
步骤S1,建立凭证信息遗漏填补系统;凭证信息遗漏填补系统,包括:凭证信息上传单元、遗漏分析单元、填补设定单元、遗漏值处理单元、预览填补单元和凭证信息输出单元;
步骤S2,凭证信息的上传:凭证信息上传单元,取得凭证信息来源的档案,将档案进行格式判断以及重新命名,并且将凭证信息进行储存得到原始凭证信息,接着传递给遗漏分析单元;
步骤S3,遗漏分析视觉化:遗漏分析单元,将原始凭证信息传递给Python中的套件进行凭证信息遗漏视觉化,得到凭证信息遗漏状态,以及计算凭证信息中的字段的遗失率,并且将原始凭证信息进行凭证信息行与列的筛选调整,将原始凭证信息储存为调整后凭证信息,并提供给填补设定单元和遗漏值处理单元使用;
步骤S4,填补设定:填补设定单元,解析读取调整后凭证信息,并且判断凭证信息字段所属的类型,以及填补字段以及选择填补方法;
步骤S4中,填补设定单元,包括第一调整后凭证信息解析读取元件、字段类型判断元件、填补字段选择元件和填补方法选择元件;
步骤S401,第一调整后凭证信息解析读取元件,从服务器取得调整后凭证信息并且对其读取分析,然后将其传递给字段类型判断元件后续使用;
步骤S402,字段类型判断元件,将第一调整后凭证信息解析读取元件提供的凭证信息读取后,将所有的字段判断出其所属的类型,分别为数值型态以及字符串型态;
步骤S403,填补字段选择元件,选择欲填补遗漏值的字段,并且传递给遗漏分析单元执行;
步骤S404,填补方法选择元件,依照字段所属的类型给予相对应填补方法,提供给遗漏分析单元执行;
当字段所属的类型为数值型态,选择的填补方法为:平均值法、最近邻居法、线性回归法、多重插补法或列表删除法;
当字段所属的类型为字符串型态,选择的填补方法为:众值、逻辑回归法或列表删除法;
步骤S5,遗漏值处理:遗漏值处理单元,读取填补设定单元所设定填补方法及填补字段,根据设定的填补方法,将凭证信息的字段删除或是遗漏填补;
步骤S6,预览填补:预览填补单元,读取填补完成凭证信息,选择图形样式并设定该图形维度的参数,通过Python套件产生出填补完成凭证信息视觉化的图形,从而了解凭证信息填补效果;
步骤S7,凭证信息输出:凭证信息输出单元,将填补完成凭证信息进行输出。
2.根据权利要求1所述的基于视觉化分析的凭证信息遗漏填补方法,其特征在于,步骤S2中,凭证信息上传单元,包括档案格式判断元件、档案重新命名元件和原始凭证信息储存元件;
步骤S201,档案格式判断元件,将上传的凭证信息进行档案的格式判断,处理的凭证信息的档案格式为EXCEL或CSV格式,否则,凭证信息须重新上传;
步骤S202,档案重新命名元件,将上传的凭证信息的档案名称重新命名,而命名规则按照来源档案名称,并且加上上传时的日期与时间;
步骤S203,原始凭证信息储存元件,将上传的凭证信息储存至服务器中得到原始凭证信息,并将原始凭证信息传递给遗漏分析单元进行读取使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江爱信诺航天信息技术有限公司,未经浙江爱信诺航天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211089881.X/1.html,转载请声明来源钻瓜专利网。





