[发明专利]一种基于人机对话的用户画像构建方法、系统、终端及存储介质有效

专利信息
申请号: 202010784250.4 申请日: 2020-08-06
公开(公告)号: CN111914076B 公开(公告)日: 2023-07-21
发明(设计)人: 王硕;吴振宇;王建明 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06F16/36;G06F16/335;G06N3/0455;G06N3/0442;G06N3/048;G06N3/09
代理公司: 深圳国新南方知识产权代理有限公司 44374 代理人: 周雷
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人机对话 用户 画像 构建 方法 系统 终端 存储 介质
【权利要求书】:

1.一种基于人机对话的用户画像构建方法,其特征在于,包括:

获取人机交互过程中的对话数据;

将所述对话数据输入属性分类模型,所述属性分类模型包括对话编码器、属性分类器和实体生成器,通过所述对话编码器对所述对话数据进行编码,通过所述属性分类器对所述编码后的对话数据进行属性类型分类,通过所述实体生成器提取各个属性类型对应的主语和宾语,所述属性分类模型将所述主语和宾语与对应的属性类型进行拼接,并输出由主语、属性类型和宾语组成的三元组信息;

根据所述三元组信息构建用户画像;

通过对话编码器对对话数据进行编码包括:

所述对话编码器包括一个双向GRU,所述双向GRU的输入为单词嵌入向量组成的序列,用于对文本数据中的每一个句子分别进行编码,得到单句级别的编码序列{h1,h2,h3,…,hn}:

上式中,e(wi,j)表示单词wi,j的嵌入向量;

所述通过对话编码器对对话数据进行编码还包括:

所述对话编码器还包括一个单向GRU,所述单向GRU的输入为所述单句级别的编码序列{h1,h2,h3,…,hn},根据GRU本身的序列编码特性将GRU每一时刻的隐状态构成新的句子嵌入表达序列{H1,H2,H3,…,Hn},使得所述新的句子嵌入表达中包含每一个句子的上下文信息:

所述通过属性分类器对编码后的对话数据进行属性类型分类包括:

所述属性分类器采用线性映射层加sigmoid激活函数层进行属性类型分类:

Pi=σ(WHi+b)

上式中,Pi表示第i个句子在所有预先定义的属性类型下的概率分布,σ表示sigmoid激活函数,W和b是线性映射的权重参数,Hi是所述单向GRU编码得到的第i个句子的嵌入表达向量。

2.根据权利要求1所述的基于人机对话的用户画像构建方法,其特征在于,所述对话数据包括语音数据或/和文本数据。

3.根据权利要求2所述的基于人机对话的用户画像构建方法,其特征在于,所述获取人机交互过程中的对话数据还包括:

通过ASR技术将所述语音数据转换为文本数据。

4.根据权利要求1所述的基于人机对话的用户画像构建方法,其特征在于,所述通过实体生成器提取各个属性类型对应的主语和宾语包括:

所述实体生成器采用GRU进行主语和宾语的提取,将实体生成定义成一个序列生成问题,所述实体生成器的目标序列为由主语和宾语拼接成的序列,所述GRU起始时刻的输入为某一种属性类型的嵌入向量,起始时刻的隐状态为对应句子由所述单向GRU进行编码的最后一个时刻得到的隐状态,使得各个属性类型分别对应一种实体生成器,通过所述实体生成器输出各个属性类型对应的主语和宾语。

5.一种基于人机对话的用户画像构建系统,所述系统用于实现权利要求1~4任一项所述的基于人机对话的用户画像构建方法,其特征在于,包括:

数据获取模块:用于获取人机交互过程中的对话数据;

属性信息提取模块:用于将所述对话数据输入属性分类模型,所述属性分类模型包括对话编码器、属性分类器和实体生成器,通过所述对话编码器对所述对话数据进行编码,通过所述属性分类器对所述编码后的对话数据进行属性类型分类,通过所述实体生成器提取各个属性类型对应的主语和宾语,所述属性分类模型将所述主语和宾语与对应的属性类型进行拼接,并输出由主语、属性类型和宾语组成的三元组信息;

用户画像构建模块:用于根据所述三元组信息构建用户画像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010784250.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top