[发明专利]一种中文关键词的模糊集构造方法在审
申请号: | 201710729995.9 | 申请日: | 2017-08-23 |
公开(公告)号: | CN107633017A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 张亚玲;周时 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 西安弘理专利事务所61214 | 代理人: | 韩玙 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 关键词 模糊 构造 方法 | ||
技术领域
本发明属于信息安全技术领域,具体涉及一种中文关键词的模糊集构造方法。
背景技术
随着云计算的兴起,云端存储的数据量也逐渐增多。越来越多的用户选择把数据存储在云端,这样可以使得开销管理最小化的同时存取效率最大化。事实上,用户和云服务是在不同的可信域里,由于数据的外包可能会存在风险,所以人们逐渐开始关注云存储的安全问题。
保证存储数据的机密性、可用性以及完整性是云存储需解决的安全问题。数据机密性是指假如没有授权是不能对数据进行解密的;数据可用性是指合法用户想用数据时可以随时使用;数据完整性是指数据在进行传输和存储时没有被篡改。企业或者个人把自己的私人数据存在云端时,可能会担心攻击者会非法访问所存储的数据。一般情况下,云服务器会通过访问控制或身份认证等方式来防止非法用户访问云服务器。但是对于公有云服务器而言,其本身的不可信就是最大的威胁。因此,越来越多的企业或者用户在外包数据时需要对数据进行加密来防止数据被非法访问或被云服务获取信息。但是数据在加密后,使得搜索变得很困难。
在对加密的文档搜索时,如果先下载云端的全部加密数据到本地进行解密,然后再搜索查询,这样会使效率非常低且需要消耗巨大的带宽。如果是在本地建立并维护一个复杂的索引结构,用户可以查询到相关密文数据块,但将会消耗大量的存储资源,且数据的共享也会变的很复杂,所以得采用更加合理的搜索方案。可搜索加密方案的提出可以有效的解决此问题,它是指数据拥有者将数据加密并存储到不可信的云端,用户给云服务器提交关键词陷门作为搜索请求,云服务器可以在不获取相关明文数据信息的前提下,搜索出包含有此关键词的搜索结果返回给用户。可搜索加密方案的安全性定义包含三条性质:关键词陷门必须由其拥有者的密钥生成;密文是不能暴露明文信息的;在给定密文和关键词陷门后仅能获得相对应的搜索结果。可搜索加密技术可以提高计算效率并降低开销,所以它有着良好的发展前景。
对于解决加密文档的搜索问题,可搜索加密方案是一个比较好的解决方法。可搜索加密有两种经典的方法:一种是基于密文扫描的方法,通过对加密文档中的关键词进行比对,确认关键词是否存在以及关键词出现的次数;另一种是基于索引方法,构建含有加密关键词的安全索引,可以搜索索引查询判断是否含有特定的关键词信息。
可搜索加密研究已经取得了比较丰硕的成果。目前,很多研究都是针对英文关键词的搜索,在中文环境下并不完全适用。例如,一个中文关键词有很多同义词或拼音相似的词等,这将给中文关键词可搜索加密带来新的问题。目前国内外在中文关键词可搜索加密,尤其是针对中文的模糊集构造方法方面的研究较少。
发明内容
本发明的目的是提供一种中文关键词的模糊集构造方法,解决了现有技术中存在的模糊集构造方法对空间和时间的消耗较高、且模糊集本身占空间较大的问题。
本发明所采用的技术方案是,一种中文关键词的模糊集构造方法,具体按照以下步骤实施:
步骤1、将输入的中文关键词拼音化处理;
步骤2、将步骤1得到的拼音进行分词处理得到特定格式的拼音;
步骤3、根据中文编辑距离的定义对步骤2得到的结果进行声母、韵母、声调的替换,输出模糊集合;
步骤4、拼音合法性检查;
步骤5、输出合法模糊集。
本发明的特点还在于,
步骤1具体为:
将输入的关键词通过拼音转化得到对应的拼音结构,包含声母、韵母和声调。
步骤2具体为:
步骤(2.1)、对拼音进行声母、韵母和声调的判断;
步骤(2.2)、用“-”依次隔开所述步骤(2.1)中关键词拼音的声母、韵母和声调;
步骤(2.3)、输出经步骤(2.2)后特定格式的拼音。
步骤3具体为:
步骤(3.1)、中文编辑距离的定义:一个拼音的声母或韵母发生变化,则取编辑距离值为2;音调的变化而造成的差异应该小于1;
步骤(3.2)、根据给定的编辑距离和改进拼音的编辑距离的定义确定声母、韵母或者声调可能变化的组合;
步骤(3.3)、根据不同的变化组合进行声母、韵母或者声调的替换;
步骤(3.4)、输出模糊集合。
步骤4具体按照以下步骤实施:
步骤(4.1)、提取步骤3中输出的模糊集合中的每个元素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710729995.9/2.html,转载请声明来源钻瓜专利网。