[发明专利]推断布局意图在审
申请号: | 201580053190.6 | 申请日: | 2015-09-28 |
公开(公告)号: | CN107077458A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | K·法鲁基;D·B·李;M·拉基塔;D·卢基奇;M·拉斯科维克;D·斯拉维斯基;A·奥布尔简;M·舍舒姆 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/22;G06F17/24;G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 刘瑜,王英 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推断 布局 意图 | ||
背景技术
当今电子文档中的大多数类型的内容已经使用明确格式化信息而不是格式意图信息来定义。例如,演示文档可以包括已被明确格式化为粗体或斜体的文本,而不是被定义为强调的文本。作为另一示例,文字处理文档可以包括明确地指示两个图像应当被放置在页面上的特定位置中的数据而不是指示图像意在作为前后比较而并排呈现的数据。
当尝试改变意图或重新布局已经使用明确格式化信息而不是格式意图信息定义的文档内容时,可能难以在具有显著不同的显示大小、能力和/或宽高比的设备上最佳地呈现文档内容。例如,使用明确格式化信息来定义以在纵向方向上适合8.5"×11"打印页面的文档中的内容可能难以以横向打印模式呈现在智能手机或平板设备上。当试图呈现使用明确格式化信息而不是格式意图信息来定义的文档内容时,也可能存在其他挑战。
关于这些考虑和其他考虑,提出了本文做出的公开内容。
发明内容
本文描述了推断布局意图的技术。通过实现本文所公开的技术,可以从明确格式化的文档元素中推断文档作者的布局意图(本文中其也可以被称为“表达意图”或“作者的格式化意图”)。然后可以使用针对文档中的明确格式化的文档元素的推断的布局意图来生成基于意图的文档。然后可以利用该基于意图的文档来以保留文档作者的原始布局意图的方式有效地呈现文档。此外,因为基于意图的文档是根据布局意图而不是通过使用明确格式化来定义的,所以可以以各种尺寸和方向,并且可以在不同类型的具有不同屏幕类型和高宽比的设备上有效地呈现文档。此外,在一些配置中,文档中的内容元素的意境(mood)和/或样式可以被修改,同时仍然保留文档作者的原始格式化意图。
为了从具有明确格式化的文档元素的文档中生成基于意图的文档,在一些配置中首先确定文档的布局类型。例如,但不限于此,启发式算法和/或机器学习分类器可以用于确定文档的布局是否为“纸状的”或“演示状的”。机器学习分类器可以是基于人类对训练文档构成的语料库中的文档布局的分类来训练。
一般而言,纸状的文档布局是意在以从上到下的方式(例如,以英语语言)被线性消费的布局。演示状的文档布局通常包括意在按顺序示出的离散“幻灯片”。演示状的文档布局还通常具有以与纸状的文档布局中重复内容不同的方式从幻灯片到幻灯片重复的内容。还可以在其他配置中识别除了纸状的和演示状的布局之外的文档布局类型。
一旦文档的布局类型已经确定,就可以确定文档中明确格式化的文档元素的布局意图。例如但不限于此,文本(包括格式化属性)可以被区分和聚类。另外,可以利用频率和/或统计知识来将意图分配给不同的聚类。还可以确定文档中的明确格式化的粗体或斜体文本旨在提供对文本的强调。例如,文档可能具有除了是非斜体格式的语块或单词外其所有文本为斜体。在这种情况下,斜体文本可能被认为是非强调的,并且太频繁的非斜体文本可能被认为是强调。可替代地,可以确定明确格式化的粗体或斜体文本旨在建立节主题、文档的标题或指定直接引用。
在一些配置中,文档元素之间的二维(“2D”)和/或三维(“3D”)空间关系可以用于推断文档作者关于那些元素或其他元素的布局意图。同样地,例如,演示状的文档中的文档元素之间的时间关系可以用于推断文档作者关于那些文档元素或其他文档元素的布局意图。还可以以其他方式确定文档作者关于明确格式化的文档元素的各种其他类型的布局意图。
在一些配置中,一个或多个启发式算法和/或一个或多个机器学习分类器确定文档中明确格式化的文档元素的布局意图。例如,但不限于此,启发式算法可以检查文档中的文档元素的模式或配置,以确定针对包含在其中的明确格式化的文档元素的推断的布局意图。
用于推断布局意图的启发式算法和/或机器学习分类器可以基于包含明确格式化的文档元素的文档的所确定的布局类型来选择和/或配置。以这种方式,用于推断该明确格式化的文档元素的布局意图的软件部件可以基于确定的文档布局类型来进行定制。用于确定布局意图的机器学习分类器还可以基于人类对训练文档语料库中的文档中的明确格式化文档元素的布局意图的分类进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580053190.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动回收铸砂系统
- 下一篇:具有通信接口的设备和用于控制数据库访问的方法