[发明专利]基于图像检测和切割的电子文档屏幕显示方法在审

专利信息
申请号: 201410209178.7 申请日: 2014-05-16
公开(公告)号: CN103970723A 公开(公告)日: 2014-08-06
发明(设计)人: 翟岩慧;张晶;陈红星 申请(专利权)人: 山西大学
主分类号: G06F17/21 分类号: G06F17/21
代理公司: 山西五维专利事务所(有限公司) 14105 代理人: 张福增
地址: 030006 山*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图像 检测 切割 电子 文档 屏幕 显示 方法
【说明书】:

技术领域

发明涉及电子信息技术,具体属于一种基于图像检测和切割的电子文档屏幕显示方法。

背景技术

计算机的迅速发展,引发了信息存储的重大变革;而电子文档的出现,也改变了人类的阅读习惯。电子书以其低碳环保(无需木材、煤、化工原料)、简单易携(容量为4G存储器可以存储1000本电子图书)、时间利用率高(可以利用各种零碎时间进行阅读学习)、查找搜索方便(可以利用索引链接、目录链接、模糊查询等快速查找手段)、价廉(电子书的销售价格远低于纸质书)、易复制存储、无损耗等优点迅速吸引了消费者。

然而,由于各种原因,许多不能编辑的电子文档(如PDF、CAJ、PDG、Djvu等格式)的屏幕显示效果并不好。例如,16开本和32开本的电子扫描书的字体并不一致,屏幕阅读体验也不同;有些书籍的字体可能偏大或偏小,需要读者缩放显示。特别是当这些电子文档需要屏幕显示时(如播放幻灯片),这种矛盾尤其突出。专家建议,当使用幻灯片进行电子投影时,所选字体的字号一般要大于28号,而且要设置1.3~1.5倍的行间距。为了达到这一要求,最方便有效的方式是对电子文档进行缩放显示,然而,缩放后的页面宽度和高度一般会远大于屏幕宽度和高度,尤其是字体偏小的电子文档,这一缺点尤其明显。一般来说,页面的高度大于屏幕高度并不会造成阅读的不便,因为演讲者可以通过上下拖动鼠标来调整可视部分;但如果页面的宽度大于屏幕宽度,则演讲者需要每行都来回拖动鼠标来调整可视部分,严重地中断了演讲者和听讲者的思路,影响了演讲或阅读效果。而通过电子文档手工制作幻灯片的方法费时费力,造成了极大的人力浪费。

发明内容

本发明的目的在于,针对电子文档中的字体偏大或偏小,不适合屏幕显示或播放,而手工制作电子幻灯片又造成了极大的人力浪费,提供一种基于图像检测和切割的电子文档屏幕显示方法。

本发明提供的一种基于图像检测和切割的电子文档屏幕显示方法,包括如下步骤:

步骤1:利用图像信息检测电子文档信息,包括电子文档的背景、行间距、行高、行首缩进和段落:

(1)对电子文档的图像进行采样,并根据采样结果计算最有可能的背景颜色。所述的电子文档图像可以通过打印、另存或屏幕截图得到。采样数越多,估算的结果就越准确。该步骤基于假设:电子文档图像中颜色重复出现最多的是背景颜色;

(2)通过对电子文档进行水平图像扫描,得到行间距分布、行高分布和左页边距分布,并估计行间距、行高和行首缩进。此处需注意,行间距可能会在标题、段落前后、甚至含有公式的行表现出显著差异。该步骤基于假设:(1)通过对文档图像中连续出现的相同宽度的背景色块进行检测,可以得到行间距分布和左页边距分布。一般来说,可能的行间距为满足如下条件的块的高度:块的宽度等于文档图像宽度。重复出现次数最多的可能行间距应该为真实行间距。可能的页边距为满足如下条件的块的宽度:块的宽度小于文档图像的一半宽度。重复出现次数最多的可能页边距应该为真实页边距,重复出现次数次多的应该为真实的行首缩进;(2)通过对文档图像中连续出现的相同宽度的非背景色块进行检测,可以得到行高分布。一般来说,重复出现次数最多的可能行高应该为真实行高。

(3)综合行间距分布和行首缩进信息得到段落划分。该步骤基于假设:如果行间距的分布不均匀,就表明该电子文档可能是通过段间距来划分段落的(有些英文文档是通过段间距而非行首缩进来划分段落的);如果行间距的分布均匀,就需要通过行首缩进来划分段落(一些英文文档和大部分中文文档都是通过行首缩进来划分段落的)。

步骤2:通过公式:像素大小=字号*96/72,来计算最终字号的像素大小,再通过公式:最佳缩放比=像素大小/行高,来计算最佳缩放比;

步骤3:根据最佳缩放比对文档图像进行缩放处理,必要时可以对图像进行平滑处理,以强化显示效果;

步骤4:根据最佳缩放比对行间距进行更新:新行间距=旧行间距*最佳缩放比;

步骤5:通过获取目标设备的分辨率来估算可放置的行文本图像的宽度,并依据该宽度生成适合屏幕显示的电子文档,具体子步骤为:

(1)获取目标设备的分辨率,并估算可放置的行文本图像的宽度;

(2)根据更新后的新行间距对电子文档图像按行进行切割得到行文本图像;

(3)根据估算得到的行文本图像宽度对行文本图像进行切割,要保证切割点位于单词和单词或汉字和汉字之间;

(4)根据切割结果编排成最终的电子文档,需要保证段间距大于等于1.5倍的新行间距,行间距调整为1.3~1.5倍的新行间距。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410209178.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top