[发明专利]一种基于C-S和GRU的看画题诗方法有效

专利信息
申请号: 201910593023.0 申请日: 2019-07-02
公开(公告)号: CN110309510B 公开(公告)日: 2023-05-12
发明(设计)人: 余昊清;朱祥祥;魏琼琼;章东平 申请(专利权)人: 中国计量大学;杭州市文海实验学校
主分类号: G06F40/30 分类号: G06F40/30;G06F16/33
代理公司: 杭州浙科专利事务所(普通合伙) 33213 代理人: 吴秉中
地址: 310018 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 gru 题诗 方法
【权利要求书】:

1.一种基于CornerNet-Saccade和GRU的看画题诗方法,其特征在于包括如下步骤:

步骤(1):收集为画题诗及为诗作画的画与诗,所述诗为五言诗,将收集到的五言诗中的每个不重复的字建立字库,并为每个字分配一个200维的向量;对画中的人和物体的位置、人和物体的类别用人工方法进行标注,画中每一个标注的人或物体代表一个意象词,为所有不重复的意象词建立词库,每张画都有欲表达的中心思想,用中心词表示中心思想,对画的中心词的类别标签人工方法进行标注,为所有不重复的中心词建立词库,为所有意象词、中心词都分配词向量,词向量大小为100维;

步骤(2):将步骤(1)标注好的画输入CornerNet-Saccade目标检测网络训练,训练集和验证集按照9:1的比例划分,模型的优化函数为计算随机梯度下降,学习速率为0.01,迭代5000次,将未标注的画输入到训练好的模型中,输出画中人、物体的预测框Bk及类别,从而得到意象词,再从词库中获取意象词对应的词向量,其中预测框Bk表示输入画中检测到的第k个预测框;将输出的预测框Bk水平和垂直方向都分成10份,对每一份都进行最大池化(max pooling),得到100维的特征使起始向量n表示输入画中检测到的所有预测框数目;

步骤(3):将步骤(1)中标注好的画送入MobileNetV3识别网络训练,训练集和验证集按照9:1的比例划分,模型的优化函数为计算随机梯度下降,学习速率为0.01,迭代5000次,将未标注的画输入到训练好的模型中,输出画对应的中心词类别,从而得到画的中心词,再从词库中获取中心词对应的词向量;

步骤(4):建立第一层GRU网络,所述第一层GRU网络由N个GRU单元组成,其中最后一个单元连接一个全连接层和一个softmax层,用于生成所题诗的前2句;第一层GRU网络输入为步骤(2)所有检测到的意象词词向量的和X和一个100的起始向量bos,即输入为C1=(X,bos),其中X=(x1+x2+…+xi+…+xn),xi表示从画中检测到的每个意向词向量;通过第一层GRU网络得到满足韵律要求的每个候选字的概率,选择概率最大的字作为五言诗的第一个字A1,然后再将第一个字的字向量输回第一层GRU网络,利用第一个字预测得到第二个字A2,并用同样的方式依次得到五言诗前2句的每个字{A1,A2,……,A10};

步骤(5):建立第二层GRU网络,所述第二层GRU网络由M个GRU单元组成,最后一个单元连接一个全连接层和一个softmax层,用于生成所题诗的后2句,第二层GRU网络的输入为意象词向量的和X和中心词向量Y组成的向量其中X、Y为100维的向量,表示后2句诗的最后一个字的字向量;通过第二层GRU网络得到满足韵律要求的每个候选字的概率,选择概率最大的字作为五言诗后2句的第一个字A11,然后再将第一个字的字向量输回第二层GRU网络,利用第一个字预测得到第二个字A12,并用同样的方式依次得到五言诗后2句的每个字{A11,A12,……,A20},双层GRU网络一同训练,模型优化函数为随机梯度下降,学习速率为0.01,迭代次数为5000次。

2.如权利要求1所述的基于CornerNet-Saccade和GRU的看画题诗方法,其特征在于:步骤(4)中所述满足韵律要求每个候选字的概率,其韵律要求包括:平仄韵律,押韵韵律;所述平仄韵律的具体实施方法:根据预先构建平仄函数和平仄矩阵以及预测的当前字的位置,确定预测当前字的平仄取值,在满足平仄取值的候选字中选取概率最大候选字;所述五言诗的平仄矩阵为:

平仄矩阵中P(i,j)代表当前字的位置,i代表诗句的行,j代表诗句的列;0表示该位置的字代表平仄不限,1或者-1代表该位置为平或者仄,2或-2表示该位置与第1句第2字平仄相同或相反,3或-3表示该位置与第1句第3字平仄相同或相反;

所述平仄函数为:

H(i,j)代表平仄取值;

所述押韵韵律的具体实施方法:预测五言诗的第2、4句的最后一个字时需要满足韵脚规律,根据预先构建的韵脚编码与汉字之间的映射表,确定要预测的当前字属于哪个汉字集,再从这个汉字集中的候选字选择概率最大的字的作为当前字;所述韵脚编码与汉字之间映射表,其特征在于:依据平韵和仄韵,将106个韵脚进行编码,第一个韵脚编码为0,最后一个韵脚编码为105,将每个韵脚编号对应的汉字组合成汉字集,在预测需要满足韵脚要求的字时,将第一句最后一个字的韵脚根据编码映射到汉字集,并除去该字,并选取其余候选字中概率最大的字作为当前字。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学;杭州市文海实验学校,未经中国计量大学;杭州市文海实验学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910593023.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top