[发明专利]基于视频获取全景图的方法和装置在审
| 申请号: | 201811249707.0 | 申请日: | 2018-10-25 |
| 公开(公告)号: | CN109462730A | 公开(公告)日: | 2019-03-12 |
| 发明(设计)人: | 王群 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | H04N5/265 | 分类号: | H04N5/265 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 宋兴;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 全景图 多张图像 视频 方法和装置 视频获取 文本 用户观看 用户显示 拼接 申请 图像 播放 | ||
本申请实施例提供一种基于视频获取全景图的方法和装置,该方法包括:在播放视频时,获取与该视频相关的文本;获取该文本中的标识;获取该标识所标识的对象的多张图像,该多张图像为该对象不同方位的图像;拼接该多张图像,得到该对象的全景图,并显示该对象的全景图。本申请实现了在用户观看视频时,向用户显示视频中的对象的全景图的目的。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种基于视频获取全景图的方法和装置。
背景技术
旅游之前先了解一下旅游目的地是非常必要的,比如用户可通过观看有关旅游目的地的视频对旅游目的地进行了解。
但是,旅游目的地的视频一般只能满足拍摄者视角的效果,当用户在使用浏览器观看旅游目的地的视频时,可能无法满足用户的需求,比如用户希望能够在观看旅游目的地的视频时得到旅游目的地的全景图。那么,在用户观看视频时,如何向用户显示视频中的对象的全景图是亟待解决的问题。
发明内容
本申请实施例提供一种基于视频获取全景图的方法和装置,实现了在用户观看视频时,向用户显示视频中的对象的全景图的目的。
第一方面,本申请实施例提供一种基于视频获取全景图的方法,应用于终端,包括:
在播放视频时,获取与所述视频相关的文本;
获取所述文本中的标识;
获取所述标识所标识的对象的多张图像,所述多张图像为所述对象不同方位的图像;
拼接所述多张图像,得到所述对象的全景图,并显示所述对象的全景图。
在一种可能的设计中,获取与视频相关的文本,包括:
获取与视频相关的第一文本和/或第二文本,所述第一文本为能够与所述视频分割的文本,所述第二文本为不能够与所述视频分割的文本。
在一种可能的设计中,所述获取所述标识所标识的对象的多张图像,包括:
将所述标识发送至服务器;
从服务器获取所述标识所标识的对象的多张图像。
在一种可能的设计中,所述从服务器获取所述标识所标识的对象的多张图像,包括:
从服务器接收入口数据,所述入口数据包括所述多张图像的标识;
根据所述入口数据,绘制全景入口图标;
接收用户通过所述全景入口图标输入的全景查看指令;
根据所述全景查看指令生成全景查看请求,并将该全景查看请求发送至服务器,所述全景查看请求包括所述多张图像的标识;
从所述服务器获取所述多张图像。
在一种可能的设计中,所述终端内缓存有所述视频的词表,所述将所述标识发送至服务器,包括:
若当前所述词表中不包括所述标识,则将所述标识发送至服务器。
在一种可能的设计中,还包括:
若当前所述词表中不包括所述标识,则添加所述标识至所述词表。
在一种可能的设计中,所述获取第二文本,包括:
根据所述视频和机器学习模型,得到区域信息,所述区域信息用于指示所述视频中的文字区域;
根据所述区域信息,获取所述视频中的文字区域;
对所述文字区域进行文本识别,得到所述第二文本。
第二方面,本申请实施例提供一种基于视频获取全景图的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811249707.0/2.html,转载请声明来源钻瓜专利网。





