[发明专利]韵律控制的诗词生成方法、装置、设备及存储介质在审
| 申请号: | 201911039063.7 | 申请日: | 2019-10-29 |
| 公开(公告)号: | CN111046648A | 公开(公告)日: | 2020-04-21 |
| 发明(设计)人: | 邓黎明;庄伯金;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/253;G06F16/33 |
| 代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 何姣 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 韵律 控制 诗词 生成 方法 装置 设备 存储 介质 | ||
本申请涉及自然语言处理,具体提供一种韵律控制的诗词生成方法、装置、设备及存储介质,该方法包括:获取源字符序列,将所述源字符序列的字符信息、句子信息、位置信息的嵌入向量和所述源字符序列的韵律嵌入向量叠加,得到综合嵌入向量;对所述综合嵌入向量进行编码处理,得到输入文本表征向量;获取初始嵌入向量和韵律控制信息,将所述初始嵌入向量和所述韵律控制信息的嵌入向量叠加,得到初始化的输出文本表征向量;对所述输出文本表征向量和所述输入文本表征向量进行解码处理,以得到所述源字符序列对应的生成语句。该方法提高了生成诗句的平仄押韵准确率,而不牺牲诗句的生成质量。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种韵律控制的诗词生成方法、装置、设备及存储介质。
背景技术
古人写诗词讲究平仄押韵,是利用汉语声调的平衡交替来造成语言中抑扬顿挫的美,读起来琅琅上口,易于记忆。目前,国内外对于诗歌生成的研究经历了由基于模板的生成方法到基于统计机器翻译的方法再到基于神经网络等方法的演变过程。
随着神经网络的兴起,基于编码器-解码器的框架也逐步应用到诗歌生成当中,该框架利用神经网络强大的拟合能力,能够生成具有一定流畅度的诗句,但在韵律的表现方面与传统的诗歌韵律规则有较大偏差。
发明内容
本申请的主要目的在于提供一种韵律控制的诗词生成方法、装置、设备及存储介质,旨在提高生成诗句的平仄押韵准确性。
第一方面,本申请提供一种韵律控制的诗词生成方法,所述韵律控制的诗词生成方法包括以下步骤:
获取源字符序列,将所述源字符序列的字符信息、句子信息、位置信息的嵌入向量和所述源字符序列的韵律嵌入向量叠加,得到综合嵌入向量;
对所述综合嵌入向量进行编码处理,得到输入文本表征向量;
获取初始嵌入向量和韵律控制信息,将所述初始嵌入向量和所述韵律控制信息的嵌入向量叠加,得到初始化的输出文本表征向量;
对所述输出文本表征向量和所述输入文本表征向量进行解码处理,以得到所述源字符序列对应的生成语句。
第二方面,本申请还提供一种诗词生成模型的训练方法,所述诗词生成模型的训练方法包括:
获取训练样本,所述训练样本包括样本字符序列,以及所述样本字符序列的后一句诗词,所述后一句诗词和所述样本字符序列的韵律相匹配;
将所述样本字符序列的字符信息、句子信息、位置信息的嵌入向量和所述样本字符序列的韵律嵌入向量叠加,得到综合嵌入向量;
对所述综合嵌入向量进行编码处理,得到输入文本表征向量;
对所述后一句诗词的韵律信息进行嵌入处理,得到韵律期望向量;
获取初始嵌入向量,将所述初始嵌入向量和所述韵律期望向量叠加,得到初始化的输出文本表征向量;
对所述输入文本表征向量和所述输入文本表征向量进行解码处理,得到所述样本字符序列对应生成语句;
根据所述生成语句的韵律信息和所述后一句诗词的韵律信息计算损失值,根据所述损失值调整所述诗词生成模型的参数。
第三方面,本申请还提供一种韵律控制的诗词生成装置,所述韵律生成装置包括:
向量叠加模块,用于获取源字符序列,将所述源字符序列的字符信息、句子信息、位置信息的嵌入向量和所述源字符序列的韵律嵌入向量叠加,得到综合嵌入向量。
编码模块,用于对所述综合嵌入向量进行编码处理,得到输入文本表征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911039063.7/2.html,转载请声明来源钻瓜专利网。





