[发明专利]一种对PDF药品文档进行超链接编辑的方法和系统有效
申请号: | 202010445799.0 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111353280B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 唐裕辉;郝华;魏巍;包卿 | 申请(专利权)人: | 浙江明度智控科技有限公司 |
主分类号: | G06F40/134 | 分类号: | G06F40/134;G06F40/253;G06F40/289;G06F40/205;G16H70/40 |
代理公司: | 杭州合谱慧知识产权代理事务所(特殊普通合伙) 33290 | 代理人: | 张刚 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 pdf 药品 文档 进行 超链接 编辑 方法 系统 | ||
1.一种对PDF药品文档进行超链接编辑的方法,其特征在于,包括:
S1,对导入的至少一PDF药品文档内容进行识别;
S2,根据待处理超链接项目的特征编辑相应的匹配规则;
S3,根据所述匹配规则形成链接项目集合,所述链接项目集合包括各项目的源文件属性、目标文件属性、以及源文件与目标文件对应关系,所述源文件当前正在编辑超链接的PDF药品文档,所述目标文件即超链接将要指向的文件;
S41,遍历各预处理的PDF药品文档链接项目集合,判断各目标文件指向位置是否已有超文本链接;
S42,当存在超文本链接时,判断目标文件属性是否存在变化;
通过验证目标文件属性有无文档、有无相应页面或相应区域属性来判断目标文件属性是否为有效信息,如果该目标文件属性为有效信息则进行添加,否则放弃添加该超链接;
当目标文件属性存在变化时删除原超链接,并判断目标文件属性是否存在对应页面或章节,如果存在则创建新超链接,否则放弃创建;
当目标文件属性无变化时,判断目标文件属性是否存在对应页面或章节,如果存在则保持原超链接,否则删除原超链接;
S43,当不存在超文本链接则创建新超链接;
S5,识别归档所参照的标准规范文件,确定所述标准规范文件各目录关键词,并打包形成归档规则库;根据归档规则库依次对完成超链接添加的各目标文件进行关键词和/或特定关系匹配,对匹配到相应归档规则库的目标文件进行编排处理后归档至相应目录中,具体的:
S511,导入并识别ICH的标准规范文件,生成文件归档目录树, 如果标准规范文件中的目录存在模版文件,则对模版文件进行智能分词,通过医药字典库提取具有较高关联性的关键字,形成用于规则库的匹配规则,所述匹配规则包括但不限于相互对应的目录编号、目录名称和关键字;
S512,对各目录标题进行划词并获取关键字,将关键字绑定至文件归档目录树;
S513,将所述文件归档目录树和其绑定的各关键字打包形成一规则库;
S52,选择归档所需至少一个规则库,并对所选规则库设置规则库优先级,所述规则库包括第一优先规则、第二优先规则或第三优先规则;其中所述第一优先规则被配置为优先将目录树的编号和/或标题制作成规则文件;所述第二优先规则被配置为优先通过提取模版文件内容或手工设置关键字制作成规则文件;所述第三优先规则被配置为根据文件后缀优先将实验室数据放置在预先规定目录中;
S53,获取需编排的药品文档列表,识别文档标题和文件内容,并进行文档关键字提取;
S54,根据规则库优先级依次对各药品文档进行关键字和/或特定关系匹配,对匹配到相应规则库的药品文档进行编排处理后归档至相应目录中。
2.根据权利要求1所述的对PDF药品文档进行超链接编辑的方法,其特征在于:所述待处理超链接项目包括注释、相关章节、参考文献、附录、表格、数字中的一个或多个。
3.根据权利要求2所述的对PDF药品文档进行超链接编辑的方法,其特征在于,所述步骤S2具体包括:
S21,在系统中编辑语法规则,根据句法结构归纳数据库将关键词和句型规则存储至模板中;
S22,对PDF药品文档识别的文本以句子为单位进行拆分;
S23,根据所述语法规则生成相应正则表达式;
S24,将规则进行匹配以获取剩余内容,对所述剩余内容进行文本纠错并去除停用词。
4.根据权利要求3所述的对PDF药品文档进行超链接编辑的方法,其特征在于:所述源文件属性包括但不限于源文件所在物理磁盘路径、文档内页码和位置,所述目标文件属性包括但不限于目标文件名称、所属页面、章节、图表和附录。
5.一种对PDF药品文档进行超链接编辑的系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-4任一所述方法的步骤。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-4任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江明度智控科技有限公司,未经浙江明度智控科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010445799.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:路径规划方法、装置及机器人
- 下一篇:一种带驱动的快速连接称重机构