[发明专利]一种数据处理方法有效
申请号: | 202111617957.7 | 申请日: | 2021-12-28 |
公开(公告)号: | CN113987593B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 赵红文;赵进;刘邦长;赵阳;孙振兴 | 申请(专利权)人: | 北京妙医佳健康科技集团有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F40/30;G06F40/289;G06F40/242;G06F21/60 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 高海涛 |
地址: | 100027 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 | ||
本申请提供了一种数据处理方法,其中,在得到主题部分中包括的关键词后,通过各关键词对该主题部分的价值对应的得分,确定该主题部分中价值较高的目标关键词,从而得到该主题部分中价值较高的词语,然后再确定出与目标关键词表达内容相似的相似词,然后确定出的各相似词和目标关键词采用不同的加密方式进行加密,以增加健康档案泄漏出去后解密的难度,并根据各个需要加密的词语的先后顺序生成用于解密的标识串序列,并生成用于对健康档案进行解密的解密二维码,以便只有用户才能对健康档案进行解密,通过上述方法,可以避免健康档案中的内容泄漏出去,从而提高了健康档案中的内容的安全性。
技术领域
本申请涉及数据加密技术领域,具体而言,涉及一种数据处理方法。
背景技术
随着社会的发展,人们对自己的隐私越来越注意,尤其是自己的健康信息。人们会不定期到健康管理机构评估自身的健康状况,并记录当前的健康情况,以形成健康档案,以便根据健康档案中记录的内容评估自身健康的发展情况,但是健康档案中的内容存在泄漏的风险,在健康档案中的内容泄漏后会对用户带来不必要的麻烦,因此目前急需一种防止健康档案中的内容泄漏的方法。
发明内容
有鉴于此,本申请实施例提供了一种数据处理方法,以避免健康档案中的内容泄漏出去。
本申请实施例提供了一种数据处理方法,包括:
在检测到对健康档案进行关闭的操作指令时,对于所述健康档案中的每一主题部分,提取该主题部分中包括的关键词;
根据为该主题部分中包括的每一关键词所表征意思进行的赋值,通过反文档概率计算用于表示该关键词在该主题部分下的价值的得分值;
确定该主题部分中得分值高于预设得分值的目标关键词;
对于每个目标关键词,通过以下公式确定该主题部分中与该目标关键词为语义相似的相似词,以将该目标关键词和所述相似词作为待加密词语:
其中,为该目标关键词,为对该主题部分中的文本进行切词后得到的各个备选词语,为大于数值0的阈值,为之间的边赋予的权重的最短路径长度;
对于每个待加密词语,利用随机算法,从词语加密库中选择该待加密词语对应的加密算法;
利用所述加密算法对对应的待加密词语进行加密,并根据各所述待加密词语在该主题部分下的文本中位置的先后顺序对各待加密词语对应的加密算法的标识进行排序;
对得到的排序结果和该主题部分的标识进行配对,以得到包含该主题部分的标识和所述排序结果的标识串;
在得到所述健康档案包括的所有主题部分的标识串后,按照各主题部分在所述健康档案中的先后顺序,对得到的多个标识串进行排序,得到标识串序列;
根据所述标识串序列和所述健康档案对应的标识生成所述健康档案的解密二维码,并将所述解密二维码发送给用户端,以使用户根据所述用户端中的解密二维码对所述健康档案进行解密。
可选地,所述提取该主题部分中包括的关键词,包括:
对获得的语音信息进行语义识别,将得到的目标语义下的词语作为所述关键词;
或者,
根据预设词典,确定该主题部分中包括的关键词;
或者,
对该主题部分下的文本内容进行分词,以将分词结果中除停用词之外的词语作为所述关键词。
可选地,所述方法还包括:
在通过二维码扫描设备得到目标解密二维码后,对所述目标解密二维码进行识别,确定所述目标解密二维码中包括的目标标识和目标标识串序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京妙医佳健康科技集团有限公司,未经北京妙医佳健康科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111617957.7/2.html,转载请声明来源钻瓜专利网。