[发明专利]一种基于声环境感知的服务机器人语音输出增益获取方法有效
申请号: | 202111258859.9 | 申请日: | 2021-10-28 |
公开(公告)号: | CN113707133B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 陶建成;刘晓峻;狄敏 | 申请(专利权)人: | 南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/20;B25J11/00;B25J9/16 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 环境 感知 服务 机器人 语音 输出 增益 获取 方法 | ||
本发明公开了一种基于声环境感知的服务机器人语音输出增益获取方法,首先确定语言可懂度指标,然后测量单位幅度信号驱动时,机器人发声系统在目标位置处产生的语声级零敏度SS;获取服务机器人工作场所的混响时间T60;使用机器人自身的传声器获取所在场景的背景噪声级NL;根据语言可懂度指标、混响时间T60、语音背景噪声级NL代入语言可懂度预测模型得到目标位置的期望语声级SPL;根据语声级零敏度SS和期望语声级SPL实时得到语音输出增益。本发明在机器人所处复杂声环境中时可考虑反射声和背景噪声的影响,有效提升机器人发声时的语音可懂度,并降低对周边环境的影响。
技术领域
本申请涉及服务机器人领域,尤其涉及一种服务机器人语音输出增益的获取方法。
背景技术
服务机器人是一种半自主或全自主工作的机器人,它能完成有益于人类健康的服务工作,但不包括从事生产的设备。其中有一类采用语音作为载体进行高效快捷的人机交互的服务机器人,从事例如银行金融业务办理、公众活动引导、等方面的工作,往往。为了保证机器人发声的清晰可懂,且尽量减少交互人员的听觉疲劳和对周边声环境的影响,就需要精确控制机器人发声时在目标区域的声压级。
CN201911300908.3介绍了一种服务机器人的人机交互控制系统,其中的语音单元包括用于采集音频信号的MIC阵列和语音处理模块,以及用于输出音频的数字功放和扬声器,有明确的连接方式和功能定义,但未介绍其实际应用情况。专利CN201610698911.5提出了机器人的声纹服务系统及其服务控制方法,通过语音输出模块引导用户进行录音建立声音模型,通过声纹匹配来判定用户身份,但未对语音输出模块的清晰度做专门的要求或约定。专利CN206869893U要求保护一种声频定向的迎宾机器人,通过方位传感器检测人体距离信号并控制音量调节器以调节定向扬声器输出声音的大小。专利CN202011185926.4通过定位标签实现机器人对解说员的跟随,利用声纹识别和语义分析识别解说员的身份并对解说内容进行选择性扩音,通过命令词的方式进行音量调节。CN112104962B提出通过人脸图像判断用户年龄调整机器人相对于用户的位置,并进一步控制扩声装置的音量和朝向。综上所述,服务机器人语音输出时的增益控制选择主要有两类方法;根据机器人与用户距离或者判断用户年龄调用预设值,根据讲解员的主观需求使用命令词进行调整。第一类方法中选取预设值时未明确考虑实际应用中机器人所处声场景(周边环境声反射影响以及背景噪声变化)。而第二类方法主要依赖于讲解员的主观需求,且命令词的识别准确率同样受到声场景的影响。因此服务机器人发声时有必要考虑声场景,合理选择语音输出时的增益,才能在保证语言可懂度的前提下,尽量减少对周边声环境的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司,未经南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111258859.9/2.html,转载请声明来源钻瓜专利网。