[发明专利]语音交互方法及系统有效
申请号: | 201810391325.5 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108564943B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 李彦孚 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G10L15/07 | 分类号: | G10L15/07;G10L15/25;G10L15/26;G10L15/30;H04L12/58 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 系统 | ||
本发明涉及一种语音交互方法及系统,所述语音交互方法,包括:获取多媒体信息,并根据多媒体信息确定进行语音交互的当前用户;根据多媒体信息确定当前用户所属群体的群体标识;根据群体标识确定对应的语音交互策略;根据语音交互策略执行语音交互功能。根据本发明的实施例,可以根据用户所属的群体确定语音交互策略,使语音交互方式具备针对性,进而可以提升用户使用体验。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音交互方法及系统。
背景技术
相关技术中,语音交互设备可以感知来自用户的语音信息并与用户进行语音交互。例如,当用户向语音交互设备提出一个问题时,语音交互设备可以播放解答内容的语音。
然而,对于不同的用户,语音交互设备的语音交互方式是固定不变的,不能因人而异。
发明内容
本发明提供一种语音交互方法及系统,以解决相关技术中的不足。
根据本发明实施例的第一方面,提供一种语音交互方法,所述方法,包括:
获取多媒体信息,并根据所述多媒体信息确定进行语音交互的当前用户;
根据所述多媒体信息确定当前用户所属群体的群体标识;
根据所述群体标识确定对应的语音交互策略;
根据所述语音交互策略执行语音交互功能。
在一些实施例中,所述多媒体信息可包括第一语音信息与图像;
所述根据所述多媒体信息确定进行语音交互的当前用户,包括:
对所述第一语音信息进行声源定位,得到所述当前用户的方位;
根据所述图像确定处于所述方位的备选用户;
从所述备选用户中确定所述当前用户。
在一些实施例中,所述从所述备选用户中确定所述当前用户,可包括:
将所述图像中唇部特征符合预设的发言条件的备选用户确定为处于发言状态的用户;
将所述处于发言状态的用户确定为所述当前用户。
在一些实施例中,所述多媒体信息可包括第一语音信息与图像;所述群体标识包括第一群体标识;
所述根据所述多媒体信息确定当前用户所属群体的群体标识,包括:
对所述第一语音信息进行语音识别,得到第一参考群体标识;
对所述图像进行图像识别,得到第二参考群体标识;
当所述第一参考群体标识与所述第二参考群体标识均为所述第一群体标识时,确定所述当前用户所属群体的群体标识为所述第一群体标识。
在一些实施例中,所述群体标识还可包括第二群体标识;
当所述第一参考群体标识与所述第二参考群体标识中任意一个为所述第二群体标识时,确定所述当前用户所属群体的群体标识为所述第二群体标识。
在一些实施例中,所述根据所述语音交互策略执行语音交互功能,可包括:
获取来自所述当前用户的第二语音信息;
对所述第二语音信息进行语音识别获得对应的语义;
根据所述语义从所述语音交互策略对应的词条数据库中获取对应的播放内容;
根据所述播放内容以及所述语音交互策略对应的音色参数、音调参数生成对应的第三语音信息;
播放所述第三语音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810391325.5/2.html,转载请声明来源钻瓜专利网。