[发明专利]基于相关性测量的断点识别在审
| 申请号: | 201580075025.0 | 申请日: | 2015-01-30 |
| 公开(公告)号: | CN107209753A | 公开(公告)日: | 2017-09-26 |
| 发明(设计)人: | S·吴;刘磊;J·J·刘 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
| 主分类号: | G06F17/00 | 分类号: | G06F17/00 |
| 代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 徐红燕,陈岚 |
| 地址: | 美国德*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 相关性 测量 断点 识别 | ||
背景技术
电子出版涉及数字图书馆的发展和电子书籍、数字杂志的数字出版物。这些数字出版物可以由寻求传达特定想法的作者创建。此外,这些数字出版物可以用作学生从事信息和/或想法交换的学习工具。
附图说明
在附图中,相似的附图标号表示相似的组件或块。以下详细描述参考附图,其中:
图1是获得数字内容的多个区域以用于断点识别的示例系统的框图;
图2A是在其中将由多个区域组成的数字内容划分成多个章节的示例断点的框图;
图2B是图示出根据针对彼此相邻定位的多个区域产生的相关性值的示例断点识别的图表;
图3A是图示出数字内容的多个区域之中的章节的示例断点的图;
图3B是区域与其中该区域所属章节和相邻章节的中心平均值之间的相似度的示例可视化的图;
图4是获得数字内容的多个区域以用于基于相关性测量来识别数字内容的多个区域之间的断点的示例方法的流程图;
图5是基于所调整的相关性测量来修改数字内容中所识别的断点的示例方法的流程图;
图6是如果内容长度低于所确定的内容最小长度,则调整断点的示例方法的流程图;和
图7是具有执行机器可读存储介质中的指令以用于基于相关性值和相似性值来修改所识别的断点的处理器的示例计算设备的框图。
具体实施方式
在数字出版中,作者或教师可以组织内容以创建电子书籍或其他类型的文档。在电子书籍创建期间的这种情况下,作者可以收集材料或内容并且按照作者所期望的顺序对这些材料进行组织;然而,作者可能难以决定如何以读者可以在逻辑上跟随并理解关键点的这种方式对这些材料或内容进行分割。例如,内容的创建者可能难以确定在材料中的哪些点处来创建通过章节和/或部分的停止点和起始点。另外,作者可能手动决定如何分割这些材料以在电子书籍中创建章节,从而耗费大量的时间和精力。手动分割章节也可能在向读者提供一致性以确保理解材料方面带来困难。尽管在遍及本文档中始终将术语章节用作内容的主要划分,然而实现不应受限制,因为章节可以另外表示内容的部分或其他类型的划分。因此,在遍及本文档中的术语章节和部分可以互换使用。
为了解决这些问题,本文所公开的示例提供了用于从作者收集的内容和/或材料使章节识别自动化的机制。示例以作者收集的顺序获得数字内容的多个区域。使用该顺序,示例计算出该顺序所提出的彼此相邻定位的数字内容的那些多个区域之间的相关性值。使用该相关性值,示例识别出数字内容的多个区域之间的断点,同时保持作者收集的数字内容的顺序。断点提供数字内容的多个区域之间的中断,从而在数字内容中创建了划分,这使章节识别自动化。使数字内容内的章节的识别自动化向作者提供了如何分割书籍或文档中的数字内容的建议。识别如何分割数字内容为作者节省了大量的时间和精力。
另外,通过识别如何分割数字内容,示例为读者从逻辑上理解和领会内容提供了更一致的分割。进一步使数字内容分割成章节自动化提供了可以在搜索查询中将其返回的内容逻辑单元。通过返回与搜索请求最相关的逻辑单元(例如,章节)而不是返回可能压垮请求者的完整文档,这给予内容更多的上下文。
本文所讨论的其他示例基于断点识别来计算所调整的相关性值。针对与所识别的断点相邻的那些区域来计算所调整的相关性值。基于该所调整的相关性值,可以准确地访问每个内容区域以确定哪个章节更适合于包括那个区域。例如,所调整的相关性值可以确定是否应该将特定区域合并到相邻章节中。合并特定区域提供了对所识别的断点的调整或修改以确保每章节都包括最合适的内容。在该实现中,对内容流进行调整或修改,从而对断点进行修改,因此内容中的中断可以在内容流中出现得更早或更晚。
然而,本文所讨论的其它示例确定了数字内容内的总内容量以及每章节中应包括的最小内容量。因此,如果基于所识别的断点的所建议章节低于最小内容量,则可以将所建议的章节合并或组合到相邻章节中。合并章节避免了过小的章节,从而向读者提供附加的一致性。
因此,本文所公开的示例在正在创建的书籍中使章节识别自动化。示例针对那些彼此相邻定位的内容或材料的区域计算出相关性值。通过计算相关性值,示例可以识别内容或材料的那些区域之间的断点。通过识别断点,示例在内容和/或材料的区域之间创建了划分分割,从而在数字内容内创建了章节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580075025.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种节能型动触头连接排
- 下一篇:一种三相三线与三相四线自适应智能电能表





