[发明专利]基于序列对抗和先验推理的电子保函自动生成方法及装置在审
申请号: | 202211178562.6 | 申请日: | 2022-09-27 |
公开(公告)号: | CN115481630A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 杨之乐;吴承科;郭媛君;刘祥飞;冯伟 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/36;G06N3/08;G06N5/04;G06Q40/00 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 刘建伟 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 序列 对抗 先验 推理 电子 自动 生成 方法 装置 | ||
本发明涉及一种基于序列对抗和先验推理的电子保函自动生成方法及装置。该方法及装置首先将获取到的初始训练数据,输入至保函生成模型中的生成器G;之后生成器G通过其自注意力编码器接收初始训练数据中的整句输入文本,输出编码器隐向量,隐向量再输入至生成器G内的解码器;最后解码器在解码阶段中,根据每次输入的一个字词就预测下一个字词,最终输出为一句完整的用于电子保函部分的语句。本发明基于序列对抗生成网络和知识图谱中的先验知识,通过学习电子自然语言书写的电子保函文本内容的形式、风格、结构,实现给定特定保险种类的自动保函生成,节约保险管理人员时间成本。
技术领域
本发明涉及电子保函领域,具体而言,涉及一种基于序列对抗和先验推理的电子保函自动生成方法及装置。
背景技术
担保函是指银行、保险公司、担保公司或个人应申请人的请求,向第三方开立的一种书面信用担保凭证。但是随着电子保函数量的增加、保函相关的业务信息难以集中展示,保函自身的时效性跟踪、分类信息查询仍需要人工介入,传统的电子担保函只改变了保函的展现形式,保函及相关业务信息的管理与原始的线下纸质保函没有发生太大变化,整个保函开具的流程需要投入大量的时间成本和人力成本,效率低下。
发明内容
本发明实施例提供了一种基于序列对抗和先验推理的电子保函自动生成方法及装置,以至少解决现有电子保函开具效率低下的技术问题。
根据本发明的一实施例,提供了一种基于序列对抗和先验推理的电子保函自动生成方法,包括以下步骤:
S101:将获取到的初始训练数据,输入至保函生成模型中的生成器G;
S102:生成器G通过其自注意力编码器接收初始训练数据中的整句输入文本,输出编码器隐向量,隐向量再输入至生成器G内的解码器;
S103:解码器在解码阶段中,根据每次输入的一个字词就预测下一个字词,最终输出为一句完整的用于电子保函部分的语句。
进一步地,在步骤S103之后,方法还包括:
S104:生成器G将输出结果输入至保函生成模型中的判别器D,对保函生成模型进行训练。
进一步地,步骤S104具体包括:
判别器D采用EMLo模型,EMLo模型接收生成器G产生的序列化文本,输出维度和现有主题词类型相同的向量,通过Softmax计算每类主题概率,选择最高概率的主题类型与实际主题类型标签对比,通过交叉熵损失反向传播方法同时更新判别器D和生成器G,对保函生成模型进行训练。
进一步地,判别器D计算损失函数时增加一惩罚项,表示待判别的句子是否包括先验高频词,如果包括,再判断是否按顺序出现,根据其顺序差异做出惩罚,对不符合经验规则的生成句子施加更高的损失。
进一步地,生成器G使用ALBERT模型,输入为文本句子与其主题类型标签;ALBERT模型被配置为:经典NLP模型BERT的轻量级优化版本,其通过对输入矩阵进行线性解耦,把原始BERT模型的输入矩阵拆分为两个小矩阵的乘积的方式减小模型参数数量。
进一步地,步骤S102具体包括:
生成器G首先使用预训练词向量将文本句子中的字词根据分词结果转换为语义数值向量,然后输入至ALBERT模型,通过其自注意力编码器接收整句输入文本,输出编码器隐向量,隐向量再输入至其解码器。
进一步地,在步骤S101之前,方法还包括:
S100:按建设项目安全风险管理经验,梳理当前建设工程电子保函的主题类型;采集不同主题类型的已有电子保函文件,提取电子保函文件的文本并使用开源中文自然语言处理工具进行预处理,按文本所属主题类别进行标注,作为初始训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211178562.6/2.html,转载请声明来源钻瓜专利网。