[发明专利]一种基于骨架的二阶段数据到文本生成方法有效
| 申请号: | 202010931906.0 | 申请日: | 2020-09-08 |
| 公开(公告)号: | CN112069777B | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 刘琼昕;王鹏;王佳升;卢士帅 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/284;G06F40/126;G06F40/216;G06N3/08 |
| 代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 骨架 阶段 数据 文本 生成 方法 | ||
1.一种基于骨架的二阶段数据到文本生成方法,其特征在于:包括以下步骤:
步骤1,基于无骨架数据集构建骨架数据集,并对其进行划分,生成骨架训练集和骨架测试集;
步骤2,基于骨架数据集对骨架构建模型进行训练和测试,输出训练好的文本骨架构建模型;
其中,骨架构建模型利用输入数据间的结构信息构造文本的骨架,包括Transformer编码器A、Transformer解码器A以及拷贝层;
其中,Transformer编码器A包括属性名编码器A与属性值编码器A,分别对属性名和属性值分别进行编码,得到相应的特征向量;Transformer解码器A对特征向量解码,得到解码器A输出向量;拷贝层对解码器A输出向量进行处理,构建文本骨架;
步骤3,对于骨架数据集中的每一个数据表,利用步骤2得到训练好的文本骨架构建模型,生成对应的文本骨架;
步骤4,对基于骨架的非自回归文本生成模型,进行训练和测试,输出训练好的基于骨架的非自回归文本生成模型;
其中,基于骨架的非自回归文本生成模型,利用骨架信息,生成逻辑性强且信息丰富的文本,包括Transformer编码器B、Transformer解码器B以及操作编辑器;
其中,Transformer编码器B包括属性名编码器B与属性值编码器B;
其中,操作编辑器包括删除编辑器、占位符编辑器以及单词编辑器,删除编辑器实现删除操作产生删除中间序列,占位符编辑器和单词编辑器实现插入操作产生插入中间序列;
步骤4,具体包括以下子步骤:
步骤4.1:在基于骨架的非自回归文本生成模型上执行步骤4.1A、步骤4.1B以及步骤4.1C;
步骤4.1A,对于骨架训练集中的每一个数据表,获取属性名和属性值的输入向量;
步骤4.1B,利用属性名编码器B与属性值编码器B,对属性名和属性值的输入向量进行编码,得到属性名和属性值的特征向量;
步骤4.1C,利用解码器B对属性名和属性值的特征向量进行解码,得到解码器B输出向量;
步骤4.2:将解码器B的输出向量输入到删除编辑器中,构建删除中间序列;
步骤4.3:将数据表的骨架输入到占位符编辑器和单词编辑器,构建插入中间序列;
步骤4.4:基于损失函数计算该基于骨架的非自回归文本生成模型的损失,利用梯度下降和反向传播算法,优化基于骨架的非自回归文本生成模型的参数;
步骤4.5:将骨架测试集数据输入到基于骨架的非自回归文本生成模型进行测试,若效果指标达到要求,停止训练并保存当前基于骨架的非自回归文本生成模型为训练好的基于骨架的非自回归文本生成模型,否则跳至步骤4.1;
步骤5:将网络中的数据表输入到训练好的骨架构建模型,生成其文本骨架,然后将文本骨架输入到训练好的基于骨架的非自回归文本生成模型,得到对应的描述文本。
2.根据权利要求1所述的一种基于骨架的二阶段数据到文本生成方法,其特征在于:步骤1,具体为:
步骤1.1,重构无骨架数据集中的每个数据表,具体为:将属性值中的单词拆开,将每个单词对应的属性名用原始属性名以及该单词在属性值中的正向位置和逆向位置表示;
其中,数据集中的每个数据表都对应一个描述该表的文本;数据表由多条记录组成,每个记录表示为:属性名-属性值;每条记录中的属性值包含多个单词;
步骤1.2,构建数据集中每个数据表的文本骨架,即构建包含文本骨架的数据集;
步骤1.3,按照一定比例,将步骤1.2构建的包含文本骨架的数据集划分为骨架训练集和骨架测试集。
3.根据权利要求2所述的一种基于骨架的二阶段数据到文本生成方法,其特征在于:步骤1.2,具体包括如下子步骤:
步骤1.2.1,设置每个数据表的文本骨架中不包含任何单词;
步骤1.2.2,枚举该数据表对应文本的每一个单词,若该单词不是停用词且在数据表的属性值列中出现过,则将该单词添加到骨架中;
步骤1.2.3,枚举完每个数据表对应的文本,得到每个数据表对应的骨架。
4.根据权利要求3所述的一种基于骨架的二阶段数据到文本生成方法,其特征在于:步骤1.3中,一定比例包括但不限于8:2、7:3、6:4以及5:5。
5.根据权利要求4所述的一种基于骨架的二阶段数据到文本生成方法,其特征在于:步骤2,具体包括以下子步骤:
步骤2.1,对于骨架训练集中的每一个数据表,获取属性名输入向量和属性值的输入向量;
步骤2.2,利用骨架构建模型中的属性名编码器A与属性值编码器A,对属性名和属性值的输入向量进行编码,得到属性名与属性值的特征向量;
步骤2.3,利用骨架构建模型中的解码器A对属性名和属性值的特征向量进行解码,得到解码器A输出向量;
步骤2.4:通过拷贝层对解码器A输出向量进行处理,生成数据表的文本骨架;
步骤2.5:基于损失函数计算该骨架构建模型的损失,利用梯度下降和反向传播算法,优化骨架构建模型的参数;
步骤2.6,将骨架测试集输入到骨架构建模型进行测试,若效果指标达到要求,停止训练并保存当前骨架构建模型为训练好的文本骨架构建模型,否则跳至步骤2.1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010931906.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





