[发明专利]一种基于智能识别的填充式自动文档排版方法及系统在审
申请号: | 202010965966.4 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112069784A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 田野;李建彬;文遥 | 申请(专利权)人: | 成都彬果科技有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186 |
代理公司: | 成都熠邦鼎立专利代理有限公司 51263 | 代理人: | 李晓英 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智能 识别 填充 自动 文档 排版 方法 系统 | ||
本发明涉及一种基于智能识别的填充式自动文档排版方法及系统,包括:1,模板生成:依据论文格式规范生成对引擎友好的模板,模板为完整的文档框架并包含预设的指令规则供引擎解析;2,内容识别:对论文原稿进行解析,生成文档结构树;3,填充式排版:模板引擎从模板中提取输入指令,传递给识别引擎,识别引擎在文档结构树中进行搜索,寻找最佳匹配的内容返回,从而实现将用户文档的内容填充至模板中;4,并生成排版后的文档。使用本发明进行排版,用户只需指定格式规范和提供原稿,排版程序即可按要求完成排版;本发明通用性高,兼容性强,使用简单灵活,能最大程度上简化用户操作,提高排版效率,提升用户体验。
技术领域
本发明涉及自动排版技术领域,尤其涉及一种基于智能识别的填充式自动文档排版方法及系统。
背景技术
论文,尤其是高校学位论文对于排版格式往往有着较为复杂且细致的要求。严格遵从格式规范对论文进行手动排版是一项耗时耗力的繁琐工作。由此,广大论文写作者对于自动排版程序的需求应运而生。自动排版程序应能按照格式要求迅速并准确地完成论文排版,极大程度上提高排版效率,并减少人工排版中较难避免的疏漏之处,使论文作者可以专注于论文内容写作而无需花费时间和精力在排版工作上。
现有的自动论文排版方法主要有两种:
方式一、解析源文件中的格式命令,按照格式命令对论文内容进行排版;
方式二、先定义论文的格式框架结构,再引导用户在格式框架内分别输入相应部分的论文内容,从而实现排版。
这两种方式均存在一定的不足之处。
方式一,需要用户在源文件中提供格式命令,通用性差,对源文件创建的要求较高,格式命令对用户不够友好,使用不够简单方便,节省的人工工作有限。
方式二,需要用户在指定编辑器内输入论文内容,待排版论文的输入源受限,使用不够灵活,需要较多的用户交互,自动化程度不高。
发明内容
本发明为了解决上述技术问题提供基于智能识别的填充式自动文档排版方法及系统。
本发明通过下述技术方案实现:
一种基于智能识别的填充式自动文档排版方法,包括以下步骤,
步骤一、内容识别:识别引擎对用户文档进行解析,识别用户文档结构和内容,生成文档结构树;
步骤二、填充式排版:模板引擎从模板中提取指令,传递给识别引擎,识别引擎在文档结构树中进行搜索,寻找最佳匹配的内容返回,从而将用户文档的内容填充至模板中;
步骤三、生成排版后的文档。
进一步的,所述识别引擎的识别算法结合机器学习、特征匹配、模式识别、逻辑推演中的至少两种方式进行智能识别。
所述识别引擎采用多种识别算法相结合进行智能识别,包括但不限于机器学习、特征匹配、模式识别及逻辑推演等。
进一步的,内容识别过程中进行多次扫描、多次识别、积极假设和充分验证,每次识别将准确的元素进行标记,在此基础上进行二次识别;
对不能准确识别的内容采取先假设再验证的方法,验证发现不合理的地方则再进行假设推演,循环往复以最终确定文档结构。
进一步的,步骤二中,对于结构性强、内容单一的固定性章节,采取直接填充;
对于结构复杂的非固定性部分,从模板提取相应部分的样式,逐一将样式复制应用于用户文档的对应结构处,再将格式化后的内容填充至模板中。
其中,基于智能识别的填充式自动文档排版方法还包括模板生成;
依据文档格式规范生成模板,模板为完整的文档框架,模板包含预设的指令规则供引擎解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都彬果科技有限公司,未经成都彬果科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010965966.4/2.html,转载请声明来源钻瓜专利网。