[发明专利]一种基于人机对话的用户画像构建方法、系统、终端及存储介质有效
| 申请号: | 202010784250.4 | 申请日: | 2020-08-06 | 
| 公开(公告)号: | CN111914076B | 公开(公告)日: | 2023-07-21 | 
| 发明(设计)人: | 王硕;吴振宇;王建明 | 申请(专利权)人: | 平安科技(深圳)有限公司 | 
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36;G06F16/335;G06N3/0455;G06N3/0442;G06N3/048;G06N3/09 | 
| 代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 | 
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 人机对话 用户 画像 构建 方法 系统 终端 存储 介质 | ||
本发明公开了一种基于人机对话的用户画像构建方法、系统、终端及存储介质。所述方法包括:获取人机交互过程中的对话数据;将所述对话数据输入属性分类模型,所述属性分类模型通过对话编码器对所述对话数据进行编码,通过属性分类器对所述编码后的对话数据进行属性类型分类,通过实体生成器提取各个属性类型对应的主语和宾语,将所述主语和宾语与对应的属性类型进行拼接,并输出由主语、属性类型和宾语组成的三元组信息;根据所述三元组信息构建用户画像。本发明能够在统一框架下自动提取人机对话中不同属性类型的显式或隐式用户属性信息,提升了用户属性信息提取的灵活性和准确性。
技术领域
本发明涉及人机交互技术领域,特别是涉及一种基于人机对话的用户画像构建方法、系统、终端及存储介质。
背景技术
随着智能对话技术的发展,对话机器人在众多的场景中得到了广泛的应用,例如垂直场景下的任务型机器人、问答机器人和开放场景下的闲聊机器人等。在用户与对话机器人的交互过程中,对话机器人常常会接收到一些关于用户个人信息的描述,自动化地提取人机交互中包含的用户属性信息并构建用户画像,进而针对性地向用户提供不同场景下的营销推荐,具有很大的商业价值。
传统的人机交互用户属性信息提取方法通常采用基于规则或者一些简单的机器学习方法,但这些方法仅能从句式相对固定的描述中提取到显式用户属性信息,而很难捕捉到用户的隐式属性表达。另外,对于不同类型的用户信息,往往需要设计不同的提取方法,然而目前并没有统一的用户信息提取框架,因此传统的人机交互用户属性信息提取方法灵活性和准确性都相对较差。
发明内容
本发明提供了一种基于人机对话的用户画像构建方法、系统、终端及存储介质,能够在一定程度上解决现有技术中存在的不足。
为解决上述技术问题,本发明采用的技术方案为:
一种基于人机对话的用户画像构建方法,包括:
获取人机交互过程中的对话数据;
将所述对话数据输入属性分类模型,所述属性分类模型包括对话编码器、属性分类器和实体生成器,通过所述对话编码器对所述对话数据进行编码,通过所述属性分类器对所述编码后的对话数据进行属性类型分类,通过所述实体生成器提取各个属性类型对应的主语和宾语,所述属性分类模型将所述主语和宾语与对应的属性类型进行拼接,并输出由主语、属性类型和宾语组成的三元组信息;
根据所述三元组信息构建用户画像。
本发明实施例采取的技术方案还包括:所述对话数据包括语音数据或/和文本数据。
本发明实施例采取的技术方案还包括:所述获取人机交互过程中的对话数据还包括:
通过ASR技术将所述语音数据转换为文本数据。
本发明实施例采取的技术方案还包括:所述通过对话编码器对对话数据进行编码包括:
所述对话编码器包括一个双向GRU,所述双向GRU的输入为单词嵌入向量组成的序列,用于对所述文本数据中的每一个句子分别进行编码,得到单句级别的编码序列{h1,h2,h3,…,hn}:
上式中,e(wi,j)表示单词wi,j的嵌入向量。
本发明实施例采取的技术方案还包括:所述通过对话编码器对对话数据进行编码还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010784250.4/2.html,转载请声明来源钻瓜专利网。





