[发明专利]文档处理方法及装置有效
| 申请号: | 201711475098.6 | 申请日: | 2017-12-29 |
| 公开(公告)号: | CN109992754B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 杨柳 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/205 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇 |
| 地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 处理 方法 装置 | ||
本公开涉及文档处理方法及装置。该方法包括:将文档中的文字进行语音转换,得到所述文档对应的音频;在所述文档中包含图像的情况下,确定所述文档中的图像与文字部分的对应关系;确定所述文档中的文字部分与所述音频中的音频片段的对应关系;根据所述文档中的图像与文字部分的对应关系,以及所述文档中的文字部分与所述音频中的音频片段的对应关系,确定所述文档中的图像与所述音频中的音频片段的对应关系;根据所述音频、所述图像以及所述文档中的图像与所述音频中的音频片段的对应关系,生成所述文档对应的目标视频。本公开在文档处理时能够避免丢失文档中的图像,从而使文档处理结果能够完整地反映文档内容,满足用户需求。
技术领域
本公开涉及计算机技术领域,尤其涉及一种文档处理方法及装置。
背景技术
智能终端设备已在人们的工作生活中普及,为人们的工作生活带来了各种各样的资讯,极大地提高了信息获取的便捷性。目前,许多智能终端设备具有将文字转换为语音输出的功能。
相关技术中,将文档转换为音频时,会丢失文档中的图像,导致无法满足用户的需求。
发明内容
有鉴于此,本公开提出了一种文档处理方法及装置。
根据本公开的一方面,提供了一种文档处理方法,包括:
将文档中的文字进行语音转换,得到所述文档对应的音频;
在所述文档中包含图像的情况下,确定所述文档中的图像与文字部分的对应关系;
确定所述文档中的文字部分与所述音频中的音频片段的对应关系;
根据所述文档中的图像与文字部分的对应关系,以及所述文档中的文字部分与所述音频中的音频片段的对应关系,确定所述文档中的图像与所述音频中的音频片段的对应关系;
根据所述音频、所述图像以及所述文档中的图像与所述音频中的音频片段的对应关系,生成所述文档对应的目标视频。
在一种可能的实现方式中,确定所述文档中的图像与文字部分的对应关系,包括:
根据所述文档中的各个段落包含第一类词或者第二类词的情况,以及所述各个段落与图像的位置关系,确定所述文档中的图像与文字部分的对应关系。
在一种可能的实现方式中,根据所述文档中的各个段落包含第一类词或者第二类词的情况,以及所述各个段落与图像的位置关系,确定所述文档中的图像与文字部分的对应关系,包括:
在所述文档的第一段落包含所述第一类词的情况下,确定所述第一段落下方的第一个图像对应的文字部分包括所述第一段落;
在所述第一段落包含所述第二类词的情况下,确定所述第一段落上方的第一个图像对应的文字部分包括所述第一段落;
在所述第一段落不包含所述第一类词和所述第二类词,且所述第一段落下方存在图像的情况下,确定所述第一段落下方的第一个图像对应的文字部分包括所述第一段落;
在所述第一段落不包含所述第一类词和所述第二类词,且所述第一段落下方不存在图像的情况下,确定所述第一段落上方的第一个图像对应的文字部分包括所述第一段落。
在一种可能的实现方式中,根据所述文档中的各个段落包含第一类词或者第二类词的情况,以及所述各个段落与图像的位置关系,确定所述文档中的图像与文字部分的对应关系,包括:
在所述文档的第一段落包含所述第一类词的情况下,确定所述第一段落下方的第一个图像对应的文字部分包括所述第一段落;
在所述第一段落包含所述第二类词的情况下,确定所述第一段落上方的第一个图像对应的文字部分包括所述第一段落;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711475098.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种翻译处理方法及终端设备
- 下一篇:汉语自然语文本远程遥控的智能购物系统





