[发明专利]基于XML的领域要素提取配置语言系统有效

专利信息
申请号: 201911130457.3 申请日: 2019-11-19
公开(公告)号: CN111078947B 公开(公告)日: 2023-06-02
发明(设计)人: 万玉晴;王霄;蒋东来 申请(专利权)人: 太极计算机股份有限公司
主分类号: G06F16/80 分类号: G06F16/80
代理公司: 北京纽乐康知识产权代理事务所(普通合伙) 11210 代理人: 王珂
地址: 100102 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 xml 领域 要素 提取 配置 语言 系统
【权利要求书】:

1.一种基于XML的领域要素提取配置语言系统,其特征在于,包括:TZIE语言规则模块、TZIE语言解析器模块、TZIE功能调度器模块,其中,

所述TZIE语言规则模块包括TZIE语言模块、定义领域词典模块、定义要素模块、定义提取方法模块、配置方法关系模块、配置操作符模块;

所述TZIE语言解析器模块,用于借助DOM4J解析XML结构,把XML文件中的要素提取配置变成计算机可识别的代码语言,完成功能调用;

所述TZIE功能调度器模块,用于依据要素提取任务中配置的操作符,到底层的功能池中调用相应的功能;

所述TZIE语言模块包括根节点tzie,所述根节点tzie用于使用节点和操作符关键字;

所述定义领域词典模块包括dict节点、keywords节点、words节点、kwspath节点;

所述dict节点用于定义词典;

所述keywords节点用于定义词典中的一组关键词;

所述定义要素模块包括concepts节点、events节点,用于依据不同领域对领域要素快捷方便的自定义;

要素的种类包括第一层级要素、第二层级要素,所述第一层级要素由概念、属性组成,所述第二层级要素由属性组成;

所述concepts节点用于配置概念集合;所述concepts节点的子节点包括concept节点,所述concept节点的子节点由method节点、methcombine节点、attribute节点组成;

所述events节点用于配置事件集合,所述events节点的子节点包括event节点,所述event节点用于配置事件;

所述attribute节点用于配置第二层级要素,所述attribute节点的子节点由所述method节点、所述methcombine节点组成;

所述定义提取方法模块包括method节点,所述method节点用于定义父节点的提取方法,所述提取方法包括规则方法、模型方法、编码方法;所述method节点的子节点包括regex节点、model节点、code节点、restrict节点、returnNum节点、factorTag节点、context节点;

所述regex节点用于配置提取要素的正则表达式;

所述model节点用于配置提取要素模型;

所述code节点用于配置提取要素代码;

所述restrict节点用于设置提取要素信息的输入文本范围;

所述returnNum节点用于设置方法所提取的要素信息条数;

所述factorTag节点用于批量提取factor节点时的配置标签;

所述context节点用于设置提取结果需要符合的过滤条件;

所述配置方法关系模块包括methcombine节点,用于配置提取方法关系;

所述methcombine节点的子节点由expression节点、priority节点组成,所述expression节点用于配置多方法组合表达式,priority节点用于配置多方法优先级关系;

所述配置操作符模块包括内置操作符,所述内置操作符包括标签类型、操作符,所述操作符的类型包括标签name属性值、具体功能操作符,所述标签name属性值用于获取标签的提取结果。

2.根据权利要求1所述的基于XML的领域要素提取配置语言系统,其特征在于,所述根节点tzie的子节点为所述dict节点、所述concepts节点、所述events节点,所述根节点tzie的内置属性由caseType内置属性、clname内置属性、clcode内置属性组成;

caseType内置属性用于配置主题类型;

clname内置属性用于设置文件名称;

clcode内置属性用于设置文件类型编码。

3.根据权利要求1所述的基于XML的领域要素提取配置语言系统,其特征在于,所述dict节点为所述根节点tzie的子节点,所述dict节点的子节点为所述keywords节点,所述keywords节点内置属性由name1内置属性、desc1内置属性组成;

所述name1内置属性用于配置关键词组名称;

所述desc1内置属性用于说明定义的关键词组;

所述keywords标签支持三种定义方式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太极计算机股份有限公司,未经太极计算机股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911130457.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top