[发明专利]一种对PDF药品文档进行超链接编辑的方法和系统有效
申请号: | 202010445799.0 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111353280B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 唐裕辉;郝华;魏巍;包卿 | 申请(专利权)人: | 浙江明度智控科技有限公司 |
主分类号: | G06F40/134 | 分类号: | G06F40/134;G06F40/253;G06F40/289;G06F40/205;G16H70/40 |
代理公司: | 杭州合谱慧知识产权代理事务所(特殊普通合伙) 33290 | 代理人: | 张刚 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 pdf 药品 文档 进行 超链接 编辑 方法 系统 | ||
本发明公开了一种对PDF药品文档进行超链接编辑的方法,包括:对导入的PDF药品文档内容进行识别;根据待处理超链接项目的特征编辑相应的匹配规则;根据所述匹配规则形成链接项目集合,所述链接项目集合包括各项目的源文件属性、目标文件属性、以及源文件与目标文件对应关系;遍历各经过预处理的PDF药品文档的链接项目集合,验证并删除无效目标文件属性后创建剩余的各超文本链接。实现了多个文档自动编辑超链接,能适应各类文档的超链接编辑要求,极大的提高了药品申报的速度。
技术领域
本发明涉及信息技术领域,尤其涉及一种对PDF药品文档进行超链接编辑的方法和系统。
背景技术
药品电子技术通用技术文档(Electronic Common Technical Document),简称eCTD,是药品的质量、安全和有效性方面的通用文件,是制药企业向药物监管机构进行信息传输的一种形式,其内容需满足通用技术文件CTD的要求。目前eCTD电子递交流程大体上可以分为三个阶段,即撰写、文档编辑与提交。申请者首先要将各类资料、数据、实验数据等进行撰写,之后由根据相关法规要求构建eCTD申报文档,再由申报负责人通过事先建立好的电子传输通道,将申报文件提交至药监部门。在整个过程中,便捷、高效、规范、环保是其主要特点,因此eCTD因其在药品注册申报环节中的诸多优势而受到美国、日本等国家药审部门的青睐,eCTD正成为全球药品注册申报的重要趋势。
其中PDF 是 eCTD 申报资料的主要文件格式,PDF文件中支持超文本链接是对评审人员非常有帮助的。然而制作这些超文本链接却不是一件容易的事。在制作超链接时,面对成百上千的pdf文件,制作人员往往需要手工搜寻相应的文件,极其劳神费力。并且不在同一页中的注释、相关章节、参考文献、附录、表格或数字,都可能会进行超链接编辑,大大增加了文件制作人员的工作量。
发明内容
本发明针对现有技术中的不足,提供了一种对PDF药品文档进行超链接编辑的方法,具体包括:
S1,对导入的至少一PDF药品文档内容进行识别;
S2,根据待处理超链接项目的特征编辑相应的匹配规则;
S3,根据所述匹配规则形成链接项目集合,所述链接项目集合包括各项目的源文件属性、目标文件属性、以及源文件与目标文件对应关系,所述源文件当前正在编辑超链接的PDF药品文档,所述目标文件即超链接将要指向的文件;
S4,遍历各经过预处理的PDF药品文档的链接项目集合,验证并删除无效目标文件属性后创建剩余的各超文本链接。
优选的,所述待处理超链接项目包括但不限于注释、相关章节、参考文献、附录、表格和/或数字中的一个或多个。
优选的,所述步骤S2具体包括:
S21,在系统中编辑语法规则,根据句法结构归纳数据库将关键词和句型规则存储至模板中;
S22,对PDF药品文档识别的文本以句子为单位进行拆分;
S23,根据所述语法规则生成相应正则表达式,关键词和句型规则将形成a*b种不同规则;
S24,将规则进行匹配以获取剩余内容,对所述剩余内容进行文本纠错并去除停用词。
优选的,所述源文件属性包括但不限于源文件所在物理磁盘路径、文档内页码和位置,所述目标文件属性包括但不限于目标文件名称、所属页面、章节、图表和附录。
优选的,所述步骤S4具体包括:
S41,遍历各预处理的PDF药品文档链接项目集合,判断各目标文件指向位置是否已有超文本链接;
S42,当存在超文本链接时,判断目标文件属性是否存在变化,如有变化则删除原链接并创建新超链接,否则保持原超链接;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江明度智控科技有限公司,未经浙江明度智控科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010445799.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:路径规划方法、装置及机器人
- 下一篇:一种带驱动的快速连接称重机构