[发明专利]基于视频获取全景图的方法和装置在审
| 申请号: | 201811249707.0 | 申请日: | 2018-10-25 |
| 公开(公告)号: | CN109462730A | 公开(公告)日: | 2019-03-12 |
| 发明(设计)人: | 王群 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | H04N5/265 | 分类号: | H04N5/265 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 宋兴;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 全景图 多张图像 视频 方法和装置 视频获取 文本 用户观看 用户显示 拼接 申请 图像 播放 | ||
1.一种基于视频获取全景图的方法,应用于终端,其特征在于,包括:
在播放视频时,获取与所述视频相关的文本;
获取所述文本中的标识;
获取所述标识所标识的对象的多张图像,所述多张图像为所述对象不同方位的图像;
拼接所述多张图像,得到所述对象的全景图,并显示所述对象的全景图。
2.根据权利要求1所述的方法,其特征在于,获取与视频相关的文本,包括:
获取与视频相关的第一文本和/或第二文本,所述第一文本为能够与所述视频分割的文本,所述第二文本为不能够与所述视频分割的文本。
3.根据权利要求1或2所述的方法,其特征在于,所述获取所述标识所标识的对象的多张图像,包括:
将所述标识发送至服务器;
从服务器获取所述标识所标识的对象的多张图像。
4.根据权利要求3所述的方法,其特征在于,所述从服务器获取所述标识所标识的对象的多张图像,包括:
从服务器接收入口数据,所述入口数据包括所述多张图像的标识;
根据所述入口数据,绘制全景入口图标;
接收用户通过所述全景入口图标输入的全景查看指令;
根据所述全景查看指令生成全景查看请求,并将所述全景查看请求发送至服务器,所述全景查看请求包括所述多张图像的标识;
从所述服务器获取所述多张图像。
5.根据权利要求3或4所述的方法,其特征在于,所述终端内缓存有所述视频的词表,所述将所述标识发送至服务器,包括:
若当前所述词表中不包括所述标识,则将所述标识发送至服务器。
6.根据权利要求5所述的方法,其特征在于,还包括:
若当前所述词表中不包括所述标识,则添加所述标识至所述词表。
7.根据权利要求2所述的方法,其特征在于,所述获取第二文本,包括:
根据所述视频和机器学习模型,得到区域信息,所述区域信息用于指示所述视频中的文字区域;
根据所述区域信息,获取所述视频中的文字区域;
对所述文字区域进行文本识别,得到所述第二文本。
8.一种基于视频获取全景图的装置,其特征在于,包括:
获取模块,用于在播放视频时,获取与所述视频相关的文本;
所述获取模块,还用于获取所述文本中的标识;
所述获取模块,还用于获取所述标识所标识的对象的多张图像,所述多张图像为所述对象不同方位的图像;
拼接模块,用于拼接所述多张图像,得到所述对象的全景图;
显示模块,用于显示所述对象的全景图。
9.根据权利要求8所述的装置,其特征在于,所述获取模块,具体用于:
将所述标识发送至服务器;
从服务器获取所述标识所标识的对象的多张图像。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,具体用于:
从服务器接收入口数据,所述入口数据包括所述多张图像的标识;
根据所述入口数据,绘制全景入口图标;
接收用户通过所述全景入口图标输入的全景查看指令;
根据所述全景查看指令生成全景查看请求,并将该全景查看请求发送至服务器,所述全景查看请求包括所述多张图像的标识;
从所述服务器获取所述多张图像。
11.根据权利要求9或10所述的装置,其特征在于,所述基于视频获取全景图的装置内缓存有所述视频的词表,所述获取模块,具体用于:
若当前所述词表中不包括所述标识,则将所述标识发送至服务器。
12.根据权利要求11所述的装置,其特征在于,还包括,添加模块;
所述添加模块,用于添加所述标识至所述词表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811249707.0/1.html,转载请声明来源钻瓜专利网。





