[发明专利]基于XML的领域要素提取配置语言系统有效
申请号: | 201911130457.3 | 申请日: | 2019-11-19 |
公开(公告)号: | CN111078947B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 万玉晴;王霄;蒋东来 | 申请(专利权)人: | 太极计算机股份有限公司 |
主分类号: | G06F16/80 | 分类号: | G06F16/80 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 王珂 |
地址: | 100102 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xml 领域 要素 提取 配置 语言 系统 | ||
1.一种基于XML的领域要素提取配置语言系统,其特征在于,包括:TZIE语言规则模块、TZIE语言解析器模块、TZIE功能调度器模块,其中,
所述TZIE语言规则模块包括TZIE语言模块、定义领域词典模块、定义要素模块、定义提取方法模块、配置方法关系模块、配置操作符模块;
所述TZIE语言解析器模块,用于借助DOM4J解析XML结构,把XML文件中的要素提取配置变成计算机可识别的代码语言,完成功能调用;
所述TZIE功能调度器模块,用于依据要素提取任务中配置的操作符,到底层的功能池中调用相应的功能;
所述TZIE语言模块包括根节点tzie,所述根节点tzie用于使用节点和操作符关键字;
所述定义领域词典模块包括dict节点、keywords节点、words节点、kwspath节点;
所述dict节点用于定义词典;
所述keywords节点用于定义词典中的一组关键词;
所述定义要素模块包括concepts节点、events节点,用于依据不同领域对领域要素快捷方便的自定义;
要素的种类包括第一层级要素、第二层级要素,所述第一层级要素由概念、属性组成,所述第二层级要素由属性组成;
所述concepts节点用于配置概念集合;所述concepts节点的子节点包括concept节点,所述concept节点的子节点由method节点、methcombine节点、attribute节点组成;
所述events节点用于配置事件集合,所述events节点的子节点包括event节点,所述event节点用于配置事件;
所述attribute节点用于配置第二层级要素,所述attribute节点的子节点由所述method节点、所述methcombine节点组成;
所述定义提取方法模块包括method节点,所述method节点用于定义父节点的提取方法,所述提取方法包括规则方法、模型方法、编码方法;所述method节点的子节点包括regex节点、model节点、code节点、restrict节点、returnNum节点、factorTag节点、context节点;
所述regex节点用于配置提取要素的正则表达式;
所述model节点用于配置提取要素模型;
所述code节点用于配置提取要素代码;
所述restrict节点用于设置提取要素信息的输入文本范围;
所述returnNum节点用于设置方法所提取的要素信息条数;
所述factorTag节点用于批量提取factor节点时的配置标签;
所述context节点用于设置提取结果需要符合的过滤条件;
所述配置方法关系模块包括methcombine节点,用于配置提取方法关系;
所述methcombine节点的子节点由expression节点、priority节点组成,所述expression节点用于配置多方法组合表达式,priority节点用于配置多方法优先级关系;
所述配置操作符模块包括内置操作符,所述内置操作符包括标签类型、操作符,所述操作符的类型包括标签name属性值、具体功能操作符,所述标签name属性值用于获取标签的提取结果。
2.根据权利要求1所述的基于XML的领域要素提取配置语言系统,其特征在于,所述根节点tzie的子节点为所述dict节点、所述concepts节点、所述events节点,所述根节点tzie的内置属性由caseType内置属性、clname内置属性、clcode内置属性组成;
caseType内置属性用于配置主题类型;
clname内置属性用于设置文件名称;
clcode内置属性用于设置文件类型编码。
3.根据权利要求1所述的基于XML的领域要素提取配置语言系统,其特征在于,所述dict节点为所述根节点tzie的子节点,所述dict节点的子节点为所述keywords节点,所述keywords节点内置属性由name1内置属性、desc1内置属性组成;
所述name1内置属性用于配置关键词组名称;
所述desc1内置属性用于说明定义的关键词组;
所述keywords标签支持三种定义方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太极计算机股份有限公司,未经太极计算机股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911130457.3/1.html,转载请声明来源钻瓜专利网。