[发明专利]一种确定响应方式的方法、装置、介质和设备在审
| 申请号: | 202010303557.8 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111507402A | 公开(公告)日: | 2020-08-07 |
| 发明(设计)人: | 游程;苏少炜;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 万晓君 |
| 地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 确定 响应 方式 方法 装置 介质 设备 | ||
1.一种确定响应方式的方法,其特征在于,所述方法包括:
接收至少两种人机交互信息,所述人机交互信息包括视频信息、音频信息或文本信息;
确定接收到的每一种人机交互信息分别对应的一个特征向量,并根据确定出的每一个特征向量,确定融合特征向量;
利用分别对应的决策分类模型,确定所述融合特征向量、每一个特征向量各自对应的至少一种响应方式,以及每种响应方式的打分结果;
根据每种响应方式的打分结果,确定一种响应方式。
2.如权利要求1所述的方法,其特征在于,根据确定出的每一个特征向量,确定融合特征向量,包括:
将确定出的每一个特征向量,分别转换为对应目标模态空间的特征向量;
将转换得到的每一个对应目标模态空间的特征向量进行拼接,得到融合特征向量。
3.如权利要求2所述的方法,其特征在于,将确定出的每一个特征向量,分别转换为对应目标模态空间的特征向量,包括:
利用深度神经网络模型,将确定出的每一个特征向量,分别转换为对应目标模态空间的特征向量。
4.如权利要求1所述的方法,其特征在于,根据每种响应方式的打分结果,确定一种响应方式,包括:
分别根据所述融合特征向量、每一个特征向量各自对应的权重,确定各自对应的每种响应方式的打分结果的加权值;
根据确定出的每种响应方式的打分结果的加权值,确定一种响应方式。
5.如权利要求4所述的方法,其特征在于,所述融合特征向量、每一个特征向量各自对应的权重,经过自适应学习得到。
6.如权利要求1~5任一所述的方法,其特征在于,确定接收到的视频信息对应的一个特征向量,包括:
利用对应的深度神经网络模型,确定接收到的视频信息对应的视频特征向量;
确定接收到的音频信息对应的一个特征向量,包括:
利用对应的深度神经网络模型,确定接收到的音频信息对应的音频特征向量;
确定接收到的文本信息对应的一个特征向量,包括:
利用预训练模型,确定接收到的文本信息对应的第一文本特征向量。
7.一种确定响应方式的装置,其特征在于,所述装置包括:
特征向量确定模块,用于接收至少两种人机交互信息,所述人机交互信息包括视频信息、音频信息或文本信息,确定接收到的每一种人机交互信息分别对应的一个特征向量;
特征向量融合模块,用于根据确定出的每一个特征向量,确定融合特征向量;
单特征决策模块,用于利用分别对应的决策分类模型,确定每一个特征向量各自对应的至少一种响应方式,以及每种响应方式的打分结果;
多特征决策模块,用于利用对应的决策分类模型,确定所述融合特征向量对应的至少一种响应方式,以及每种响应方式的打分结果;
决策融合模块,用于根据所述单特征决策模块和所述多特征决策模块确定出的每种响应方式的打分结果,确定一种响应方式。
8.如权利要求7所述的装置,其特征在于,所述特征向量融合模块,具体用于将确定出的每一个特征向量,分别转换为对应目标模态空间的特征向量;将转换得到的每一个对应目标模态空间的特征向量进行拼接,得到融合特征向量。
9.如权利要求8所述的装置,其特征在于,所述特征向量融合模块,用于将确定出的每一个特征向量,分别转换为对应目标模态空间的特征向量,包括:利用深度神经网络模型,将确定出的每一个特征向量,分别转换为对应目标模态空间的特征向量。
10.如权利要求7所述的装置,其特征在于,所述决策融合模块,具体用于分别根据所述融合特征向量、每一个特征向量各自对应的权重,确定各自对应的每种响应方式的打分结果的加权值;根据确定出的每种响应方式的打分结果的加权值,确定一种响应方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010303557.8/1.html,转载请声明来源钻瓜专利网。





