[发明专利]基于增强学习的室内声源找寻方法、介质、设备和装置在审

申请号：	201811613315.8	申请日：	2018-12-27
公开（公告）号：	CN109520511A	公开（公告）日：	2019-03-26
发明（设计）人：	王学文;姜增如;金洪龙;单小熙	申请（专利权）人：	北京普诺兴科技有限公司
主分类号：	G01C21/20	分类号：	G01C21/20;G01S5/22
代理公司：	北京轻创知识产权代理有限公司 11212	代理人：	杨立;王丹
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	目标声音寻址动作目标声源声源采集环境信息环境感知模块目标声源位置声音采集模块移动物体运动室内计算机程序一次性移动存储介质环境信息控制模块模型生成人为干预容错能力生成模块相关参数信号对应学习算法移动物体找寻装置鲁棒性处理器学习成功率存储驱动
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于增强学习的室内声源找寻方法，其特征在于，包括以下步骤：

S01，采集环境信息和目标声音信号；

S02，根据所述环境信息和所述目标声音信号，使用经增强学习算法训练后的目标找寻模型生成寻址动作；

S03，根据所述寻址动作驱动移动物体运动至所述目标声音信号对应的目标声源位置。

2.根据权利要求1所述的基于增强学习的室内声源找寻方法，其特征在于，还包括S04，所述S04具体为：获取移动物体是否到达目标声源位置的判断结果，若已到达，则找寻过程结束，若没有到达，则返回S01更新环境信息和目标声音信号，并重新生成寻址动作。

3.根据权利要求1或2所述的基于增强学习的室内声源找寻方法，其特征在于，S02中采用增强学习算法训练生成目标找寻模型具体为：

S201，建立初始找寻模型；

S202，采集环境信息和训练声音信号，并采用初始找寻模型生成寻址动作，根据所述寻址动作驱动移动物体运动至所述训练声音信号对应的训练声源位置；

S203，获取采用预设评价算法对所述移动物体的运动过程进行评价的评价结果，并根据所述评价结果对所述初始找寻模型进行更新；

S204，重复S202-203，直至达到预设训练结束条件，并生成目标找寻模型。

4.根据权利要求3所述的基于增强学习的室内声源找寻方法，其特征在于，S203中，所述预设评价算法具体为：获取所述移动物体运动过程中的运动数据，查询预设的对应关系表，根据所述运动数据所处的区间获取对应的奖惩值；所述运动数据包括当前时刻所述移动物体与训练声源的距离、所述移动物体与障碍物的碰撞次数、所述移动物体的运动时间和所述移动物体的运动步数中的至少一个。

5.根据权利要求4所述的基于增强学习的室内声源找寻方法，其特征在于，所述S204具体为：采集移动后的训练声源发出的训练声音信号以及环境信息，并采用更新后的找寻模型生成寻址动作，然后根据寻址动作驱动移动物体运动至移动后的训练声源位置，并获取采用预设评价方法对本次运动过程进行评价的评价结果，根据所述评价结果再次对所述找寻模型进行更新，重复上述过程直至达到预设训练结束条件，并生成目标找寻模型。

6.一种计算机可读存储介质，其特征在于，存储有计算机程序，所述计算机程序被处理器执行时，实现权利要求1-5任一项所述的方法。

7.一种基于增强学习的室内声源找寻设备，其特征在于，包括权利要求6所述的计算机可读存储介质和处理器，所述处理器执行所述计算机可读存储介质上的计算机程序时实现如权利要求1-5任一项所述方法的步骤。

8.一种基于增强学习的室内声源找寻装置，其特征在于，包括声音采集模块、环境感知模块、寻址动作生成模块和控制模块，

所述声音采集模块用于采集目标声音信号；

所述环境感知模块用于采集环境信息；

所述寻址动作生成模块用于根据所述环境信息和所述目标声音信号，使用经增强学习算法训练后的目标找寻模型生成寻址动作；

所述控制模块用于根据所述寻址动作驱动移动物体运动至所述目标声音信号对应的目标声源位置。

9.根据权利要求8所述的基于增强学习的室内声源找寻装置，其特征在于，所述寻址动作生成模块包括训练单元和存储单元，所述训练单元具体包括：

模型建立单元，用于建立初始找寻模型；

移动控制单元，用于采集环境信息和训练声音信号，并采用初始找寻模型生成寻址动作，根据寻址动作驱动移动物体运动至所述训练声音信号对应的训练声源位置；

模型优化单元，用于获取采用预设评价算法对所述移动物体的运动过程进行评价的评价结果，根据所述评价结果对所述初始找寻模型进行更新，并采用更新后的找寻模型重复运动过程和评价过程直到达到预设训练结束条件，生成目标找寻模型；

所述存储单元用于存储所述目标找寻模型。

10.根据权利要求9所述的基于增强学习的室内声源找寻装置，其特征在于，所述模型优化单元具体用于采集移动后的训练声源发出的训练声音信号以及环境信息，并采用更新后的找寻模型生成寻址动作，然后根据寻址动作驱动移动物体运动至移动后的训练声源位置，并获取采用预设评价方法对本次运动过程进行评价的评价结果，根据所述评价结果再次对所述找寻模型进行更新，重复上述运动过程和评价过程直至达到预设训练结束条件，并生成目标找寻模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京普诺兴科技有限公司，未经北京普诺兴科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811613315.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于虚拟现实技术的室内导航方法及系统
下一篇：一种卫星精密定轨方法及装置

同类专利

专利分类

G 物理

G01 测量；测试
G01C 测量距离、水准或者方位；勘测；导航；陀螺仪；摄影测量学或视频测量学
G01C21-00 导航；不包含在G01C 1/00至G01C 19/00组中的导航仪器
G01C21-02 .应用天文学的方法
G01C21-04 .应用陆地测量法
G01C21-10 .通过速度或加速度的测量
G01C21-20 .执行导航计算的仪器
G01C21-24 .专用于宇宙航行的导航

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于增强学习的室内声源找寻方法、介质、设备和装置在审

专利文献下载