[发明专利]数据存储方法及相关装置在审
| 申请号: | 202310668439.0 | 申请日: | 2023-06-07 | 
| 公开(公告)号: | CN116628127A | 公开(公告)日: | 2023-08-22 | 
| 发明(设计)人: | 陶威 | 申请(专利权)人: | 中国银行股份有限公司 | 
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/81;G06F16/835 | 
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 周初冬 | 
| 地址: | 100818 *** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 数据 存储 方法 相关 装置 | ||
1.一种数据存储方法,其特征在于,包括:
获得待存储的文档数据;
将所述文档数据转化为第一长度的json数据;
从所述json数据中提取关键数据存储至xml文件中,并计算各所述关键数据的哈希值以标识至所述xml文件的对应位置。
2.根据权利要求1所述的方法,其特征在于,所述将所述文档数据转化为第一长度的json数据,包括:
若所述文档数据是结构化文档,则根据所述结构化文档的结构顺序,将所述结构化文档的各字段依次提取并进行拼接后存储至第一长度的json文件中。
3.根据权利要求1所述的方法,其特征在于,所述将所述文档数据转化为第一长度的json数据,包括:
若所述文档数据是非结构化文档,则根据所述非结构化文档中的各字符的顺序,将所述非结构化文档的各字符依次提取并进行拼接后存储至第一长度的json文件中。
4.根据权利要求1所述的方法,其特征在于,所述从所述json数据中提取关键数据存储至xml文件中,并计算各所述关键数据的哈希值以标识至所述xml文件的对应位置,包括:
对所述json数据中的内容进行分词,得到多个词语;
将各所述词语两两进行组合,得到多组词语;
针对各所述词语,两两配对进行语义计算,得到对应的语义相似度;
针对任一组所述词语,若对应的所述语义相似度大于预设相似度阈值,则统计所述词语的使用频率;
针对所述使用频率最高的词语,生成相应的哈希值;
将各所述词语按照在所述json数据中的顺序,依次存储至所述xml文件的各存储单元中,并为各所述存储单元分别标识所述哈希值。
5.根据权利要求4所述的方法,其特征在于,在所述针对任一组所述词语,若对应的所述语义相似度大于预设相似度阈值,则统计所述词语的使用频率之后,所述方法还包括:
针对除了所述使用频率最高的词语之外的其他词语,将所述其他词语添加至对应的相似问字段中;
针对任一所述存储单元,将对应的所述相似问字段与所述存储单元关联。
6.根据权利要求1所述的方法,其特征在于,在从所述json数据中提取关键数据存储至xml文件中,并计算各所述关键数据的哈希值以标识至所述xml文件的对应位置之后,所述方法还包括:
若所述json数据对应存储在至少2份所述xml文件中,则在所述xml文件的底部标识下一份xml文件的位置。
7.一种数据存储装置,其特征在于,包括:文档获得单元、文档转化单元和数据存储单元;
所述文档获得单元,用于获得待存储的文档数据;
所述文档转化单元,用于将所述文档数据转化为第一长度的json数据;
所述数据存储单元,用于从所述json数据中提取关键数据存储至xml文件中,并计算各所述关键数据的哈希值以标识至所述xml文件的对应位置。
8.根据权利要求7所述的装置,其特征在于,所述文档转化单元,包括:第一转化子单元;
所述第一转化子单元,用于若所述文档数据是结构化文档,则根据所述结构化文档的结构顺序,将所述结构化文档的各字段依次提取并进行拼接后存储至第一长度的json文件中。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1至6中任一项所述的数据存储方法。
10.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至6中任一项所述的数据存储方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310668439.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种GPT模型优化方法和装置
 - 下一篇:一种复合风味基料、蚝油及其制备方法
 
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
 - 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
 - 数据发送方法、数据发送系统、数据发送装置以及数据结构
 - 数据显示系统、数据中继设备、数据中继方法及数据系统
 - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
 - 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
 - 数据发送和数据接收设备、数据发送和数据接收方法
 - 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 





