[发明专利]多要素识别的方法及装置有效
申请号: | 201711181129.7 | 申请日: | 2017-11-23 |
公开(公告)号: | CN108021934B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 刘佳;崔恒斌;张家兴 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 要素 识别 方法 装置 | ||
1.一种训练多要素识别模型的方法,包括:
获取输入文本,以及所述输入文本在多个类别中的各个类别的已标定要素;所述输入文本中的要素为预定义的要素,所述预定义的要素是从知识库中预先存储的知识点中提取的关键词集合;
获取与所述输入文本有关的用户状态,从所述用户状态中提取出状态特征;
将所述输入文本和所述状态特征作为多要素识别模型的输入,根据所述状态特征,确定所述输入文本在所述多个类别中的各个类别的备选要素及其对应的概率值,其中所述状态特征被输入到所述多要素识别模型的隐藏层进行分析;
基于各个类别的备选要素及其对应的概率值,以及所述各个类别的已标定要素,确定各个类别的损失函数;
基于所述各个类别的损失函数确定总损失函数;
基于所述总损失函数,更新所述多要素识别模型。
2.根据权利要求1所述的方法,其中所述获取输入文本包括:从所述输入文本中提取文本特征,所述文本特征包括所述输入文本中的词。
3.根据权利要求2所述的方法,其中所述多要素识别模型包括卷积神经网络CNN模型,
所述利用多要素识别模型,确定所述输入文本在所述多个类别中的各个类别的备选要素及其对应的概率值包括:
采用所述CNN模型,对所述文本特征中的词构成的词向量进行过滤、卷积以及池化处理。
4.根据权利要求3所述的方法,其中所述多要素识别模型包括长短期记忆LSTM模型,
所述利用多要素识别模型,确定所述输入文本在所述多个类别中的各个类别的备选要素及其对应的概率值包括:
采用所述LSTM模型,对所述文本特征中的词构成的词序列进行时间递归处理。
5.根据权利要求1所述的方法,还包括:
获取与所述输入文本有关的用户的行为记录和/或服务记录,从所述行为记录和/或服务记录中分别提取出行为特征和/或服务特征;
所述利用多要素识别模型,确定所述输入文本在所述多个类别中的各个类别的备选要素及其对应的概率值包括:
将所述行为特征和/或所述服务特征作为所述多要素识别模型的输入,根据所述行为特征和/或所述服务特征确定所述输入文本在各个类别下的备选要素及其对应概率值。
6.根据权利要求1所述的方法,其中所述基于各个类别的损失函数确定总损失函数包括:
为各个类别的损失函数分配对应的权重,
通过对所述各个类别的损失函数加权求和,确定总损失函数。
7.一种识别用户对话文本中的要素的方法,该方法基于权利要求1至6任一项方法得到的多要素识别模型来识别所述要素,该方法包括:
获取用户的对话文本;
获取所述用户的用户状态,从所述用户状态中提取出状态特征;
将所述对话文本和所述状态特征输入多要素识别模型,使其根据所述状态特征输出所述对话文本在多个类别中的各个类别的备选要素及其对应的概率值,其中所述多要素识别模型是基于训练过程中的识别结果在所述多个类别下的总损失函数而训练;
根据所述各个类别的备选要素及其对应的概率值,确定所述对话文本在各个类别的要素。
8.根据权利要求7所述的方法,还包括:
获取所述用户的行为记录和/或服务记录,从所述行为记录和/或服务记录中分别提取出行为特征和/或服务特征;
将所述行为特征和/或所述服务特征输入所述多要素识别模型,使其根据所述行为特征和/或所述服务特征确定所述对话文本在各个类别下的备选要素及其对应概率值。
9.根据权利要求7所述的方法,其中,根据所述各个类别的备选要素及其对应的概率值,确定所述对话文本在各个类别的要素包括:
将每个类别下概率值最高的备选要素确定为该类别的要素;或者
将概率值高于预定阈值的备选要素确定为对应类别下的要素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711181129.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数字地铁3D可视化方法及系统
- 下一篇:一种数控机床专用脚轮