[发明专利]一种语音交互方法和装置在审
申请号: | 201811488569.1 | 申请日: | 2018-12-06 |
公开(公告)号: | CN111292734A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 孙尧 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06K9/00 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 方法 装置 | ||
1.一种语音交互方法,包括:
接收用户输入的语音指令,以及拍摄所述语音指令对应的第一人脸图像;
在所述第一人脸图像满足预设条件的情况下,根据所述第一人脸图像,确定所述用户的身份信息;
根据所述用户的身份信息,以及对所述语音指令的识别结果,向所述用户提供个性化服务。
2.如权利要求1所述的方法,根据所述第一人脸图像,确定所述用户的身份信息,包括:
确定第一人脸图像数据库,所述第一人脸图像数据库中包括多个用户身份标识,以及所述多个用户身份标识中任一用户身份标识对应的第二人脸图像;
将所述第一人脸图像与所述任一用户身份标识对应的所述第二人脸图像进行匹配;
根据匹配结果,确定所述用户对应的目标用户身份标识,所述目标用户身份标识用于表示所述用户的身份信息。
3.如权利要求2所述的方法,通过以下方式确定得到所述第一人脸图像数据库:
获取历史语音指令集合,所述历史语音指令集合中包括多个历史语音指令和多个历史人脸图像,所述多个历史人脸图像中任一历史人脸图像对应一个历史语音指令;
对所述多个历史人脸图像进行人脸聚类,得到所述多个用户身份标识、所述任一用户身份标识对应的所述第二人脸图像,以及所述任一用户身份标识对应的历史语音指令。
4.如权利要求3所述的方法,根据匹配结果,确定所述用户对应的目标用户身份信息,包括:
当所述第一人脸图像与所述多个用户身份标识中的一个用户身份标识对应的所述第二人脸图像之间的匹配度大于第一预设阈值时,将所述用户身份标识确定为所述目标用户身份标识。
5.如权利要求3所述的方法,还包括:
在所述第一人脸图像不满足所述预设条件的情况下,从所述语音指令中提取第一声纹特征;
根据所述第一声纹特征,确定所述用户的身份信息。
6.如权利要求5所述的方法,根据所述第一声纹特征,确定所述用户的身份信息,包括:
确定第一声纹特征数据库,所述第一声纹特征数据库中包括所述多个用户身份标识,以及所述任一用户身份标识对应的第二声纹特征;
将所述第一声纹特征与所述任一用户身份标识对应的所述第二声纹特征进行匹配;
根据匹配结果,确定所述用户对应的所述目标用户身份标识;
其中,所述第一声纹特征与所述第二声纹特征为相同或不同的声纹特征。
7.如权利要求6所述的方法,通过以下方式确定得到所述第一声纹特征数据库:
从所述任一用户身份标识对应的历史语音指令中,提取所述用户身份标识对应的所述第二声纹特征。
8.如权利要求7所述的方法,还包括:
将所述多个历史语音指令中与所述多个历史人脸图像均不对应的历史语音指令,确定为待匹配历史语音指令;
提取所述待匹配历史语音指令对应的第三声纹特征;
当所述第三声纹特征与所述多个用户身份标识中的一个用户身份标识对应的所述第二声纹特征之间的匹配度大于第二预设阈值时,将所述待匹配历史语音指令确定为与所述用户身份标识对应的历史语音指令;
所述第二声纹特征和所述第三声纹特征为相同或不相同的声纹特征。
9.如权利要求8所述的方法,还包括:
根据所述任一用户身份标识对应的所述第二人脸图像,确定所述用户身份标识对应的第一用户画像;
所述用户身份标识对应的第一用户画像,用于反映与所述用户身份标识对应的用户的年龄和/或性别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811488569.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种脊椎骨接骨装置
- 下一篇:交互方法、装置及计算机设备