[发明专利]一种基于智能识别的填充式自动文档排版方法及系统在审
申请号: | 202010965966.4 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112069784A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 田野;李建彬;文遥 | 申请(专利权)人: | 成都彬果科技有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186 |
代理公司: | 成都熠邦鼎立专利代理有限公司 51263 | 代理人: | 李晓英 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智能 识别 填充 自动 文档 排版 方法 系统 | ||
1.一种基于智能识别的填充式自动文档排版方法,其特征在于:包括以下步骤;
步骤一、内容识别:识别引擎对用户文档进行解析,识别用户文档结构和内容,生成文档结构树;
步骤二、填充式排版:模板引擎从模板中提取指令,传递给识别引擎,识别引擎在文档结构树中进行搜索,寻找最佳匹配的内容返回,从而将用户文档的内容填充至模板中;
步骤三、生成排版后的文档。
2.根据权利要求1所述的基于智能识别的填充式自动文档排版方法,其特征在于:所述识别引擎的识别算法结合机器学习、特征匹配、模式识别、逻辑推演中的至少两种方式进行智能识别。
3.根据权利要求1或2所述的基于智能识别的填充式自动文档排版方法,其特征在于:内容识别过程中进行多次扫描、多次识别、积极假设和充分验证,每次识别将准确的元素进行标记,在此基础上进行二次识别;
对不能准确识别的内容采取先假设再验证的方法,验证发现不合理的地方则再进行假设推演,循环往复以最终确定文档结构。
4.根据权利要求1所述的基于智能识别的填充式自动文档排版方法,其特征在于:步骤二中,对于结构性强、内容单一的固定性章节,采取直接填充;
对于结构复杂的非固定性部分,从模板提取相应部分的样式,逐一将样式复制应用于用户文档的对应结构处,再将格式化后的内容填充至模板中。
5.根据权利要求1所述的基于智能识别的填充式自动文档排版方法,其特征在于:它还包括模板生成;
依据文档格式规范生成模板,模板为完整的文档框架,模板包含预设的指令规则供引擎解析。
6.根据权利要求1所述的基于智能识别的填充式自动文档排版系统,其特征在于:包括,
接收模块:用于接收排版请求,所述排版请求包括用户文档;
识别模块:用于对用户文档进行解析,识别用户文档结构和内容,生成文档结构树;
填充排版模块:用于将用户文档的内容填充至模板中;
排版后的文档生成模块:用于将排版结果写入磁盘,生成排版后的文档。
7.根据权利要求6所述的基于智能识别的填充式自动文档排版系统,其特征在于:它还包括模板生成模块:用于生成模板,模板包含预设的指令规则供引擎解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都彬果科技有限公司,未经成都彬果科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010965966.4/1.html,转载请声明来源钻瓜专利网。