[发明专利]一种确定语音机器人播报策略的方法及装置在审
申请号: | 202111535977.X | 申请日: | 2021-12-15 |
公开(公告)号: | CN114283853A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 李健;叶飞;陈明;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L17/00;G10L17/22;G10L15/26;G10L15/28 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张岳峰 |
地址: | 100038 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 语音 机器人 播报 策略 方法 装置 | ||
本发明公开了一种确定语音机器人播报策略的方法及装置。该发明包括:识别目标对话过程对应的多个感知属性,其中,多个感知属性至少包括以下属性:目标用户的性别、目标用户的年龄、目标用户的情绪、目标用户的语速、目标用户的外貌特征、目标用户的对话音量、目标对话过程的背景音,目标用户对应于目标对话过程;确定同属于一个优先级的同级感知属性,并依据同级感知属性计算对应的优先级对应的最终得分;依据最终得分,确定语音机器人的播报策略,其中,播报策略为以下至少一种:播报内容、播报方式。通过本发明,解决了相关技术中语音机器人与用户的交互过程生硬,交互体验不佳的问题。
技术领域
本发明涉及机器人领域,具体而言,涉及一种确定语音机器人播报策略的方法及装置。
背景技术
相关技术中,语音机器人的目标是模拟人来与用户进行语音交流,它需实现:能听(用户说的内容),思考(给用户的回应),会说(回应内容)。语音机器人应用的领域有:智能客服、智能导航、智能外呼、语音助手等。
现有的语音机器人主要使用了三种AI技术:ASR、NLU、TTS。对话交互的过程为:采集用户的音频;调用ASR,将音频内容识别为文本内容;调用NLU,输入识别文本,根据NLU中的知识库,返回应答文本;调用TTS,将应答文本合成音频,向用户播报;重复以上过程。
现有的语音机器人调用ASR将用户说的语音识别成文本内容后,将识别文本送入NLU,得到回应内容,然后播报给用户。NLU的应答内容只依赖于ASR识别出的文本内容。即同一个应用场景中,知识库相同,只要ASR识别出的文本内容相同,则后续播报的音频也一样,表现出的效果就是:用户说出同样的内容,就只能听到相同的回答信息。但实际人与人的交互过程中,对于同一个问题,我们会感知对方的综合信息(性别、年龄、情绪、交谈的背景环境等)的不同,而给出更合适的回复。此种方式只考虑了用户说话的内容,并未考虑到其他因素(如用户的性别、年龄、情绪、背景音等),交互过程显得生硬,交互体验不佳。
针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种确定语音机器人播报策略的方法及装置,以解决相关技术中语音机器人与用户的交互过程生硬,交互体验不佳的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种确定语音机器人播报策略的方法。该发明包括:识别目标对话过程对应的多个感知属性,其中,多个感知属性至少包括以下属性:目标用户的性别、目标用户的年龄、目标用户的情绪、目标用户的语速、目标用户的外貌特征、目标用户的对话音量、目标对话过程的背景音,目标用户对应于目标对话过程;确定同属于一个优先级的同级感知属性,并依据同级感知属性计算对应的优先级对应的最终得分;依据最终得分,确定语音机器人的播报策略,其中,播报策略为以下至少一种:播报内容、播报方式。
进一步地,识别目标对话过程对应的多个感知属性,包括:在采集不到目标用户的图像的情况下,获取目标对话过程对应的目标语音,调用ASR语音识别器对目标语音进行识别,以确定多个感知属性;在可以采集到目标用户的图像的情况下,获取目标对话过程对应的目标语音以及目标用户的图像,调用ASR语音识别器对目标语音进行识别以确定第一感知属性,并分析目标用户的图像以确定第二感知属性,其中,第一感知属性至少包括以下属性:目标用户的情绪、目标用户的语速、目标用户的对话音量、目标对话过程的背景音,第二感知属性至少包括以下属性:目标用户的性别、目标用户的年龄、目标用户的外貌特征。
进一步地,在确定同属于一个优先级的同级感知属性,并依据同级感知属性计算对应的优先级对应的最终得分之前,该方法包括:确定每个感知属性对应的优先级、权重以及分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111535977.X/2.html,转载请声明来源钻瓜专利网。