[发明专利]一种确定响应方式的方法、装置、介质和设备在审
| 申请号: | 202010303557.8 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111507402A | 公开(公告)日: | 2020-08-07 |
| 发明(设计)人: | 游程;苏少炜;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 万晓君 |
| 地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 确定 响应 方式 方法 装置 介质 设备 | ||
本发明涉及一种确定响应方式的方法、装置、介质和设备。其中,在确定响应方式的过程中,可以接收文本信息、视频信息和音频信息这三种人机交互信息中的至少两种。并可以确定接收到的每一种人机交互信息分别对应的特征向量,以及对应所有接收到的人机交互信息的融合特征向量,利用融合特征向量,以及每一种人机交互信息分别对应的特征向量,来分别确定至少一种响应方式,以及每种响应方式的打分结果。并可以根据每种响应方式的打分结果,确定一种响应方式。从而可以综合考虑各种不同类型的人机交互信息分别对应的特征向量,以及将各种不同类型的人机交互信息进行融合得到的信息对应的融合特征向量,来确定响应方式,提高确定出的响应方式的准确性。
技术领域
本发明涉及人工智能技术领域,特别涉及一种确定响应方式的方法、装置、介质和设备。
背景技术
人机交互是人工智能的一个重要研究领域,旨在使用人工智能技术,帮助智能机器人深刻理解用户需求,并作出正确的响应(也可以理解为决策),响应方式可以是任何可能的行为,例如,语音播报各种内容,提问各种问题,移动到各个位置等等,来反馈用户需求。
目前现有技术主要基于文本进行人机交互。基于文本进行人机交互,是利用自然语言处理(NLP)等相关技术,根据用户通过输入框输入的文本或者对用户输入的语音,进行语音识别(ASR)得到的文本,理解用户需求并确定对应的响应方式。
由于目前帮助智能机器人确定响应方式的信息比较局限,仅基于单一的文本信息,导致现有的人机交互方案中,对用户需求的理解不够准确,从而导致智能机器人无法做出正确的响应。
发明内容
本发明实施例提供一种确定响应方式的方法、装置、介质和设备,用于解决智能机器人确定出的响应方式的准确率较低的问题。
本发明提供了一种确定响应方式的方法,所述方法包括:
接收至少两种人机交互信息,所述人机交互信息包括视频信息、音频信息或文本信息;
确定接收到的每一种人机交互信息分别对应的一个特征向量,并根据确定出的每一个特征向量,确定融合特征向量;
利用分别对应的决策分类模型,确定所述融合特征向量、每一个特征向量各自对应的至少一种响应方式,以及每种响应方式的打分结果;
根据每种响应方式的打分结果,确定一种响应方式。
本发明还提供了一种确定响应方式的装置,所述装置包括:
特征向量确定模块,用于接收至少两种人机交互信息,所述人机交互信息包括视频信息、音频信息或文本信息,确定接收到的每一种人机交互信息分别对应的一个特征向量;
特征向量融合模块,用于根据确定出的每一个特征向量,确定融合特征向量;
单特征决策模块,用于利用分别对应的决策分类模型,确定每一个特征向量各自对应的至少一种响应方式,以及每种响应方式的打分结果;
多特征决策模块,用于利用对应的决策分类模型,确定所述融合特征向量对应的至少一种响应方式,以及每种响应方式的打分结果;
响应方式融合模块,用于根据所述单特征决策模块和所述多特征决策模块确定出的每种响应方式的打分结果,确定一种响应方式。
本发明还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述的方法。
本发明还提供了一种确定响应方式的设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010303557.8/2.html,转载请声明来源钻瓜专利网。





