[发明专利]一种基于句式控制的宋词载体文本信息隐藏方法、系统在审
| 申请号: | 201710934941.6 | 申请日: | 2017-10-09 |
| 公开(公告)号: | CN107992466A | 公开(公告)日: | 2018-05-04 |
| 发明(设计)人: | 刘彦辰;孙亭;李毅;满青珊;徐斌;丁杰;黄利 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F21/62 |
| 代理公司: | 北京中知法苑知识产权代理事务所(普通合伙)11226 | 代理人: | 常玉明 |
| 地址: | 210007 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 句式 控制 宋词 载体 文本 信息 隐藏 方法 系统 | ||
技术领域
本发明涉及信息安全领域,特别是一种基于句式控制的宋词载体文本信息隐藏方法、系统。
背景技术
现有的使用机器生成宋词的方案,如苏劲松等人提出基于统计学分析的宋词切分语料库生成的方法。通过结合性较强的二词或三词来建立宋词词表,进而按照宋词规律进行宋词划分和语料库生成。和何晶等人使用统计学方法利用大数据量的词汇数据库和语言模型进行格律诗词生成,二者均是利用了数据库概论学模型进行宋词生成,生成宋词的成功率很难达到100%,且无法在句式上与宋词词牌相对应。周昌乐等人提出基于遗传算法的一种宋词自动生成方法,但因其生成的宋词可嵌入信息较少,成功率低等因素无法作为信息隐藏的合适载体。故已有的一些方案无法在如何生成贴近真实宋词的技术上研究不多,且很难提供安全可靠的信息隐藏载体供安全通信使用。
发明内容
本发明的目的在于提供一种可以机器生成宋词的方法,并且以宋词为载体对带隐藏的秘密信息进行嵌入,从而在信道中进行安全通信。
本发明公开一种基于句式控制的宋词载体文本信息隐藏方法,包括:
S1:采取句式控制算法对宋词语料库的宋词和格律模板T进行处理,结合《文学意向词典》中韵律和词性相同的词语进行补充填入,得到用于信息隐藏和提取的韵律-词性词典D;
S2:结合韵律-词性词典D,采用信息隐藏算法(SPC-Steg)对输入的原始信息进行隐写处理,将原始信息转换为二进制串的形式,根据所述宋词格律模板T将所述二进制串划分位二进制划分段,对每个二进制划分段进行编码,得到所述原始信息对应的隐写宋词S;
S3:通过格律模板T和韵律-词性词典D,采用提取算法还原隐写宋词S,得到原始信息。
优选的,所述格律模板T的韵律具体包括:中仄、平平、平中仄、中平、中仄,所述宋词的词性具体包括动词,名词,形容词,动名词。
优选的,所述采取句式控制算法对宋词语料库的宋词和格律模板T进行处理.具体包括:
S11:对所述宋词语料库的宋词依照格律模板T,进行韵律拆分,得到韵律词典;
S12:对所述韵律词典的每个韵律块Rj所对应的词语通过词性提取工具进行处理,然后进行如下操作;
S13:每次读取两个单字或双字的字符串放在s1,s2中;
S14:如果s1或s2的词语长度小于约定的组合词语长度L,则执行步骤S15,反之则根据s1或s2的词语的韵律-词性关系重制原有的韵律-词性词典;
S15:判断s1和s2的词语词性,将s1和s2按照不同的词性构造成新的词语,依照不同词性输出到韵律一词性词典D。
优选的,所述约定的组合词语长度L具体包括:L=2或L=3。
优选的,所述采用信息隐藏算法(SPC-Steg)对输入的原始信息进行隐写处理,具体包括:
S21:获取格律模板T每个韵律位置对应的韵律-词性信息;
S22:将输入的原始信息转换为二进制编码;
S23:为格律模板T提供可嵌入信息长度L,若输入的原始信息m长度小于L,则在所述二进制编码后进行补零;
S24:获取韵律-词性词典D中词语的个数,放入所述二进制编码长度Len内;
S25:获取下一个位置可嵌入的信息量长度B,并将B转换为十进制数;
S26:将格律模板T对应位置匹配得到韵律-词性词典D;
S27:将韵律-词性词典D中编码为n的词进行匹配,得到十进制索引。同时按照索引将每个词填入宋词S的每个位置,进而输出一篇完整含有隐藏信息的隐写宋词S。
优选的,所述采用提取算法还原隐写宋词S,得到原始信息,具体包括:
S31:获取格律模板T每个位置对应的格律词性信息,将接收到的宋词S与格律模板T进行匹配;
S32:对于宋词S中每个格律划分块在韵律-词性词典D中进行二分查找;
S33:在十进制索引下的韵律-词性词典D中找到对应的词并获取该词的索引;
S34:得到格律模板T对应位置二进制编码长度Len;
S35:将十进制索引转换为对应位置的信息容量二进制编码串;
S36:迭代生成二进制串的原始信息m’;
S37:返回原始信息m’至接收方。
一种基于句式控制的宋词载体文本信息隐藏系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710934941.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光学成像镜头
- 下一篇:一种锅炉管道用显微镜支撑机构





