[发明专利]基于深度学习的单轮对话数据分类方法、装置和电子设备有效
| 申请号: | 201810644408.0 | 申请日: | 2018-06-21 |
| 公开(公告)号: | CN108959482B | 公开(公告)日: | 2022-01-21 |
| 发明(设计)人: | 杨鹏 | 申请(专利权)人: | 北京慧闻科技(集团)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33 |
| 代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰 |
| 地址: | 100124 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 轮对 数据 分类 方法 装置 电子设备 | ||
本申请涉及基于深度学习的单轮对话数据分类方法、装置和电子设备。该方法包括:对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示;通过双向长短期记忆层处理所述单轮对话数据的词向量表示以获得与所述单轮对话数据对应的隐状态序列;以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达;以及,以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布。这样,可以通过双向长短期记忆和注意力机制对单轮对话数据中的用户特征进行提取,从而改进单轮对话场景下的分类效果。
技术领域
本发明总体地涉及数据处理领域,且更为具体地,涉及一种基于深度学习的单轮对话数据分类方法、装置和电子设备。
背景技术
随着互联网技术的发展,越来越多的网站采用对话系统对用户进行服务。例如,在线票务预订网站或者在线购物网站通过与用户的在线对话来解决用户需求。
在使用上述对话系统的过程中,为了提高服务效率,需要对用户输入进行大概分类。例如,可以通过用户意图分析确定预定场景下的用户意图,比如机票预订场景下的查询、订票、退票等意图。此外,还可能需要从用户的对话中获得其它信息,例如用户针对服务或者商品所要表达的主观情绪等。
因此,如何基于对话系统中的用户数据,比如用户与系统之间的单轮对话数据挖掘出用户对于客观事物的感受,以更为全面地获取用户对于特定客观现实,比如事件或商品所要表达的主观信息,已逐渐成为当前自然语言处理领域的研究热点。
因此,需要改进的用于对话系统的数据分类方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于深度学习的单轮对话数据分类方法、装置和电子设备,其通过双向长短期记忆和注意力机制对单轮对话数据中的用户特征进行提取,从而改进单轮对话场景下的分类效果。
根据本申请的一方面,提供了一种基于深度学习的单轮对话数据分类方法,包括:对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示;通过双向长短期记忆层处理所述单轮对话数据的词向量表示以获得与所述单轮对话数据对应的隐状态序列;以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达;以及,以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布。
在上述基于深度学习的单轮对话数据分类方法中,在以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布之后进一步包括:将与所述概率分布中最大概率对应的标签确定为所述单轮对话数据的分类结果。
在上述基于深度学习的单轮对话数据分类方法中,所述标签是所述单轮对话数据所反映的用户意图,以及,对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示包括:对所述单轮对话数据进行实体识别以获得所述单轮对话数据中每个词对应的实体标签;对所述单轮对话数据进行词性标注以获得所述单轮对话数据中每个词对应的词性标签;将所述单轮对话数据中的每个词及其实体标签和词性标签进行向量转化以获得所述每个词的词向量矩阵、所述实体标签的实体向量矩阵和所述词性标签的词性向量矩阵;以及,连接所述词向量矩阵、所述实体向量矩阵以及所述词性向量矩阵以获得所述单轮对话数据的词向量表示。
在上述基于深度学习的单轮对话数据分类方法中,以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达包括:计算所述每个隐状态的平均值以获得临时句子向量;基于每个隐状态和所述临时句子向量通过神经网络计算每个隐状态对应的权重;以及,基于所述每个隐状态对应的权重对所述隐状态序列进行加权求和以获得所述句子向量表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慧闻科技(集团)有限公司,未经北京慧闻科技(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810644408.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于位置信息的艺术品数据库
- 下一篇:一种基于搜索的学习辅助方法及电子设备





