[发明专利]基于文本生成网络生成用户描述文本的方法和装置有效

专利信息
申请号: 202110189520.1 申请日: 2021-02-19
公开(公告)号: CN112949315B 公开(公告)日: 2022-07-22
发明(设计)人: 李怀松;张天翼;黄涛 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F16/35;G06F16/33;G06N3/04;G06N3/08;G06N20/00
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁;周良玉
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文本 生成 网络 用户 描述 方法 装置
【说明书】:

本说明书实施例提供一种基于文本生成网络生成用户描述文本的方法和装置,方法包括:将目标用户的各项特征输入第一编码器,通过第一编码器获取各项特征分别对应的各初始用户特征向量,基于自注意力机制进行编码,得到编码状态向量;将编码状态向量输入检索模型,通过检索模型从人工知识库中检索出K个语句,确定K个语句包含的各个字对应的字编码向量,根据解码器的输出反馈向量以及字编码向量确定各注意力系数,并根据各注意力系数对各字编码向量进行加权求和,得到语义表征向量;将编码状态向量、语义表征向量输入解码器,通过解码器生成目标用户的用户描述文本,解码器的隐藏状态作为输出反馈向量。能够提升得到的文本质量。

技术领域

本说明书一个或多个实施例涉及计算机领域,尤其涉及基于文本生成网络生成用户描述文本的方法和装置。

背景技术

由于用户的用户特征与该用户的用户类别之间具有关联关系,因此可以基于用户的用户特征对该用户进行分类。用户特征可以是用户的年龄、学历、收入等数据,用户类别可以包括多个预先设定的类别,例如,是否具有还款风险、是否具有洗钱风险等。通常地,仅仅给出用户的用户特征和该用户的用户类别并不具有说服力,因此在获取到用户的用户特征之后,还需要基于用户特征生成用户描述文本,用户描述文本包括多个语句,能够体现用户特征和用户类别之间的关联关系。对用户描述文本的要求是逻辑紧密、论证充足、简洁易懂的规范性报文。

现有技术中,常常基于文本生成网络生成用户描述文本,也就是说通过机器学习的方式生成用户描述文本,由于用于训练文本生成网络的训练样本数量较少,因此该方式得到的文本质量不佳。

因此,希望能有改进的方案,能够提升得到的文本质量。

发明内容

本说明书一个或多个实施例描述了一种基于文本生成网络生成用户描述文本的方法和装置,能够提升得到的文本质量。

第一方面,提供了一种基于文本生成网络生成用户描述文本的方法,所述文本生成网络包括第一编码器、检索模型和解码器,方法包括:

将目标用户的各项特征输入第一编码器,通过所述第一编码器获取目标用户的各项特征分别对应的各初始用户特征向量,对所述各初始用户特征向量基于自注意力机制进行编码,得到编码状态向量;

将所述编码状态向量输入检索模型,通过所述检索模型从人工知识库中检索出K个语句,确定所述K个语句包含的各个字对应的字编码向量,根据所述解码器的输出反馈向量以及所述字编码向量确定各个字分别对应的各注意力系数,并根据各注意力系数对所述各字编码向量进行加权求和,得到所述K个语句对应的语义表征向量;

将所述编码状态向量、所述语义表征向量输入解码器,通过所述解码器生成所述目标用户的用户描述文本,所述解码器的隐藏状态作为所述输出反馈向量。

在一种可能的实施方式中,所述第一编码器包括基于时序的单向编码结构,所述将目标用户的各项特征输入第一编码器,通过所述第一编码器获取目标用户的各项特征分别对应的各初始用户特征向量,包括:

将所述目标用户的各项特征依次作为所述第一编码器各个时刻的输入,将所述第一编码器各个时刻的输出作为所述各初始用户特征向量。

在一种可能的实施方式中,所述第一编码器包括基于时序的双向编码结构,所述将目标用户的各项特征输入第一编码器,通过所述第一编码器获取目标用户的各项特征分别对应的各初始用户特征向量,包括:

将所述目标用户的各项特征依照第一顺序依次输入所述第一编码器,根据所述第一编码器各个时刻的输出得到各项特征的第一特征向量;

将所述目标用户的各项特征依照与所述第一顺序相反的顺序依次输入所述第一编码器,根据所述第一编码器各个时刻的输出得到各项特征的第二特征向量;

将对应于同一项特征的第一特征向量和第二特征向量进行组合,作为该项特征的初始用户特征向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110189520.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top