[发明专利]表单处理方法和装置有效
申请号: | 201710773557.2 | 申请日: | 2017-08-31 |
公开(公告)号: | CN107632972B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 王琰 | 申请(专利权)人: | 北京秒针人工智能科技有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06F40/174 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 祝乐芳;刘芳 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表单 处理 方法 装置 | ||
本发明提供一种表单处理方法和装置,通过获取N个表单的数据结构,分析表单包含的字段名,以及字段名与字段位置的对应关系,对N个表单进行筛选,从中确定包含目标类字段名的M个表单,根据M个表单的字段名与字段位置的对应关系,对M个表单的数据进行融合,生成目标表单,从而,将M个表单的数据合并为一个目标表单,通过对目标表单进行分析处理,以丰富进行数据分析的样本的数据量,提高数据分析效果。
技术领域
本发明涉及计算机技术,尤其涉及一种表单处理方法和装置。
背景技术
表单是非常常见的一种用于收集信息的工具,例如:酒店信息反馈卡、员工个人信息登记表、学生个人信息登记表或者学习成绩单等。
不同的表单具有不同的数据结构,其包含的字段名以及字段名对应的字段位置都可能不同,例如:A酒店信息反馈卡包含的字段名为:姓名、性别、联系方式、身份证号码以及消费时间等;B酒店信息反馈卡包含的字段名为:姓名、性别、联系方式以及房间编号等;为了便于信息管理或者其他用途,通常会对多个表单收集的信息进行数据分析,例如:获取某用户的所有联系方式,现有技术中,通常只是针对同一数据结构的表单进行数据分析。
然而,采用现有技术的方式,对表单进行数据分析数据量不够丰富,获取到的数据不够全面,分析效果不佳。
发明内容
本发明提供一种表单处理方法和装置,以丰富进行数据分析的样本的数据量,提高分析效果。
第一方面,本发明实施例提供一种表单处理方法,包括:
获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;
根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;
根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;
对所述目标表单进行分析处理。
可选地,所述根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单,包括:
获取所述M个表单中每个表单的数据项;其中,每个表单包含多个数据项,每个数据项中包含所述表单的字段名对应的赋值;
根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项;
对所述具有关联关系的数据项进行融合,得到目标数据项;
根据所述目标数据项生成所述目标表单。
可选地,所述根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项,包括:
获取S个关键字段名的优先权值,所述S为大于等于1的整数;
根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率;
确定所述匹配率大于等于预设匹配率的两个数据项具有关联关系。
可选地,所述根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率,包括:
若两个数据项中的同一个关键字段名的赋值相同,则所述关键字段名的匹配率为所述关键字段名的优先权值;
若两个数据项中的同一关键字段名的赋值不同,则所述关键字段名的匹配率为0;
确定所述S个关键字段名的匹配率的和值为所述两个数据项的匹配率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京秒针人工智能科技有限公司,未经北京秒针人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710773557.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成多维报表的方法和装置
- 下一篇:资产的录入方法和装置