[发明专利]一种针对XML文件的数据自适应融合方法有效
申请号: | 201910184557.8 | 申请日: | 2019-03-12 |
公开(公告)号: | CN109977269B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 宫琳;王晋意;洪泽华;陈西;高俊;杨奥 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/83 | 分类号: | G06F16/83 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李微微;仇蕾安 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 xml 文件 数据 自适应 融合 方法 | ||
本发明公开了一种针对XML文件的数据自适应融合方法,可以避免人工分析数据特点导致的时间较长、受经验约束较大、准确性较低等问题;在分析过程中综合考虑了历史记录、专家知识与实际业务需求三方面因素,既保证了数据处理方法的可靠性,又保证数据处理方法贴合实际需求。
技术领域
本发明属于数据处理技术领域,具体涉及一种针对XML文件的数据自适应融合方法。
背景技术
随着科学技术的发展,人类社会积累的数据量越来愈大,数据来源也越来越多。数据融合是一种可以综合利用不同来源的数据、吸取不同数据源的特点、最终给出比单一数据源更加完整结果的数据处理方法。随着相关研究的深入,数据融合的方法日益丰富,在处理具体数据时采用何种方法成为困扰数据处理人员的难题。传统的做法是数据处理人员根据自身已有的经验、专家知识等进行处理。这样的做法不仅效率低下,而且准确率不高,严重制约了数据融合过程的速度、结果的精度。特别是在业务过程对数据融合的速度、精度等提出特别要求的时候,数据处理人员往往需要尝试各种方法才能满足指定要求。因此迫切需要一种数据自适应融合方法,不仅可以结合已有经验、专家知识,还能在综合考虑业务需求的基础上为待处理数据选择合适的数据融合方法。
发明内容
有鉴于此,本发明的目的是提供一种针对XML文件的数据自适应融合方法,可以保证据处理方法的可靠性,又保证数据处理方法贴合实际需求。
一种针对XML文件的数据自适应融合方法,包括如下步骤:
步骤1、针对XML格式的待处理数据,在数据融合的历史记录中找到与待处理数据相似度大于设定阈值的一系列同类型文档,组成相似文档集合;
步骤2、根据数据融合方法本身适用的数据类型和待处理数据本身的数据类型,为待处理数据选择一系列可处理该数据的融合方法;
步骤3、针对步骤2确定的每一种融合方法,读取该融合方法资料,确定该融合方法理论上适用于处理的文档数据;
步骤4、计算待处理数据与步骤3确定的文档数据之间的相似度;
步骤5、针对步骤1组成的相似文档集合,计算步骤3的每一种融合方法被相似文档集合中所有文档所使用的方法推荐度;将该方法推荐度与步骤4计算的相似度相乘,得到一种融合方法对应的优先度;
步骤6、采用步骤3至步骤5的方法,遍历步骤2选择的每一种融合方法,得到各融合方法对应的优先度;
步骤7、将步骤6获得的所有优先度进行降序排列;取其中排序靠前的设定数量的融合方法;
步骤8、针对步骤7选取的每一个融合方法,在历史记录中调取各融合方法处理过的与待处理数据同类型历史文档;同时确定每一个融合方法理论上适用的文档;将所有融合方法对应的同类型历史文档与理论上适用的文档组成文档合集;
步骤9、确定待处理数据的业务需求和步骤8的文档集合中各文档的业务需求;
步骤10、从文档合集中选择与待处理数据的业务需求最相似的一部分文档,再确定这些文档使用次数最多的一种融合方法,即为待处理数据最终选择的融合方法。
进一步的,所述步骤10中,当这些文档使用次数最多的融合方法不止一种的情况下,在本步骤中选择最相似的一部分文档时,增加选择的文档的数量。
较佳的,所述步骤1和4中,计算相似度时,采用相同的方式提取待处理数据和同类型文档的特征,根据两者之间的特征匹配度确定相似度。
较佳的,所述相似度的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910184557.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置