[发明专利]视觉辅助方法、装置及计算机可读存储介质在审
申请号: | 202110106026.4 | 申请日: | 2021-01-26 |
公开(公告)号: | CN114792393A | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 屈杨森 | 申请(专利权)人: | TCL科技集团股份有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;A61H3/06;G10L13/02 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李红艳 |
地址: | 516006 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉 辅助 方法 装置 计算机 可读 存储 介质 | ||
本申请适用于计算机技术领域,提供了一种视觉辅助方法、装置及计算机可读存储介质,其中,视觉辅助方法包括:获取目标场景数据;将目标场景数据输入预设场景描述模型,得到用于描述目标场景的场景描述信息;根据场景描述信息生成语音信息。本申请提供的视觉辅助方法智能性高。
技术领域
本申请属于计算机技术领域,尤其涉及一种视觉辅助方法、装置及计算机可读存储介质。
背景技术
视觉障碍是指视觉器官的构造或机能发生部分或全部障碍,对外界事物无法或较难作辨识。视觉障碍者往往需要视觉辅助装置进行辅助以完成日常生活中的相关行为,例如,行走。
传统技术中存在一种视觉辅助装置,主要包括超声换能器和耳机。超声换能器向前发射超声脉冲波,并接收反射回来的超声脉冲波,反射回来的超声脉冲波传输至耳机,视觉障碍者通过耳机里声音的变化感知前方的障碍物。
然而,这种视觉辅助装置存在智能性差的问题。
发明内容
本申请实施例提供了视觉辅助方法、装置及计算机可读存储介质,可以解决传统技术中视觉辅助装置智能性差的问题。
第一方面,本申请实施例提供了一种视觉辅助方法,包括:
获取目标场景数据;
将目标场景数据输入预设场景描述模型,得到用于描述目标场景的场景描述信息;
根据场景描述信息生成语音信息。
第二方面,本申请实施例提供了一种视觉辅助装置,包括:
获取模块,用于获取目标场景数据;
描述模块,用于将目标场景数据输入预设场景描述模型,得到用于描述目标场景的场景描述信息;
语音模块,用于根据场景描述信息生成语音信息。
第三方面,本申请实施例提供了一种视觉辅助装置,包括:存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述第一方面中任一项视觉辅助方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面中任一项视觉辅助方法。
上述视觉辅助方法、装置及计算机可读存储介质,通过获取目标场景数据,将目标场景数据输入预设场景描述模型,得到用于描述目标场景的场景描述信息,并进一步根据场景描述信息生成语音信息。本实施例提供的方法能自动识别描述目标场景中的事物,无需用户自行判断周围存在的障碍物等,智能性高,实用性强。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的视觉辅助装置的结构示意图;
图2是本申请一实施例提供的视频辅助方法的流程示意图;
图3是本申请另一实施例提供的视频辅助方法的流程示意图;
图4是本申请又一实施例提供的视频辅助方法的流程示意图;
图5是本申请一实施例提供的图像描述模型的结构示意图;
图6是本申请一实施例提供的初始图像描述模型结构及训练过程示意图;
图7是本申请一实施例提供的视频描述模型的结构示意图;
图8是本申请一实施例提供的视频辅助方法的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL科技集团股份有限公司,未经TCL科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110106026.4/2.html,转载请声明来源钻瓜专利网。