[发明专利]电价政策条款解析方法、存储介质及计算机在审
| 申请号: | 202010644374.2 | 申请日: | 2020-07-07 |
| 公开(公告)号: | CN112036150A | 公开(公告)日: | 2020-12-04 |
| 发明(设计)人: | 李玫;丁德智;李国栋;张海俊 | 申请(专利权)人: | 远光软件股份有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/31;G06F16/33;G06F16/332;G06K9/62 |
| 代理公司: | 广东朗乾律师事务所 44291 | 代理人: | 闫有幸 |
| 地址: | 519000 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电价 政策 条款 解析 方法 存储 介质 计算机 | ||
1.一种电价政策条款解析方法,其特征在于,包括:
(1)构建一个解析模板,存储并供调用;所述解析模板包括电价政策条款需要解析出来的关键元素项,关键元素项包括:执行对象、实施地区、标准执行条件、特殊执行条件、执行价格、政策名称;
(2)接收电价政策条款文档,并以电子化的信息存储并供调用;
(3)通过正则表达式及需剔除的固定文本,剔除所述电价政策条款文档中除所述关键元素项以外的信息;
(4)顺序或者同时执行步骤(4-1)、(4-2)、(4-3)、(4-4):
(4-1)从所述条款文档中解析并提取与执行价格相关的信息,作为提取的执行价格信息;
(4-2)从所述条款文档中解析出与实施地区相关的信息;
(4-3)从所述条款文档中解析出与特殊执行条件相关的信息,作为提取的特殊执行条件信息;
(4-4)从所述条款文档中解析出与执行对象及政策名称相关的信息;
(5)利用提取的执行价格信息对与执行对象及政策名称相关的信息进行消歧,剔除不合理结果,保留的信息作为提取的政策名称信息及执行对象信息;
(6)根据提取的政策名称信息从依据专家整理的电价政策体系中关联出相应的标准执行条件信息;
(7)根据所提取的政策名称信息对所述与实施地区相关的信息进行修正,修正后的信息作为提取的实施地区信息;
(8)将所述提取的执行价格信息、实施地区信息、标准执行条件、特殊执行条件、执行对象信息及政策名称信息,按照所述解析模板生成结构化数据。
2.根据权利要求1所述的解析方法,其特征在于,步骤(4-1)具体为:先根据正则表达式确定执行价格所属模式,再通过执行该执行价格所属模式下设定的解析结果表达式,提取出所述执行价格信息;每次只提取一种执行价格所属模式的执行价格信息,条款文档剔除匹配内容后,查看是否还能符合其他模式,直至无可匹配结果。
3.根据权利要求1所述的解析方法,其特征在于,步骤(4-2)具体为:预先整理国家县级以上所有行政地区,汇总成行政地区库;按条款内容、条款所在段落整段内容、条款所在政策文档的通知对象内容、条款所在政策文档整篇内容的优先级顺序与行政地区库进行地区词匹配,若在某一步匹配成功,则将匹配结果作为最终实施地区;若匹配失败,则进入下一步匹配;若所有内容匹配完仍无结果,则解析失败。
4.根据权利要求1所述的解析方法,其特征在于,所述特殊执行条件是指提取日期类和管理对象名称类的特殊执行条件;所述步骤(4-3)具体包括:首先,预先总结可能出现的日期类特殊执行属性及对应关键词,用所述条款文档与各关键词进行匹配,若匹配成功,则表示所述条款文档中出现对应执行属性;之后,根据正则表达式确定所述条款文档中日期所属模式,通过执行该模式下设定的解析结果表达式,得出日期提取结果;最后,将特殊执行属性与日期提取结果进行拼接,得出日期类和管理对象名称类的特殊执行条件;其中,若所述条款文档中出现多个特殊执行属性及日期,则根据特殊执行属性与日期在条款中出现的位置尽可能近为准则进行配对。
5.根据权利要求1所述的解析方法,其特征在于,步骤(4-4)具体为:对所述条款文档先进行搜索识别政策名称,若无识别结果,则与专家根据历史解析经验总结的政策-关键词库匹配,识别政策名称。
6.根据权利要求5所述的解析方法,其特征在于,所述搜索识别政策名称具体包括:
借助lucene全文检索引擎工具包,首先为已知的管理对象名称建立倒排索引;然后输入条款内容,返回与其BM25相似度大于设定阈值的管理对象名称;
将所述管理对象名称根据以下规则进一步剔除:(1)只保留相似度最高的前5条结果;(2)剔除掉与条款内容重合词为0个的返回结果;(3)若两条返回结果与条款内容匹配词相同,则剔除掉相似度更低的那条结果;(4)若几条结果与条款内容的匹配词有包含关系,则只保留匹配词个数最多的那一条结果;
最后,剔除剩余结果需用匹配词与条款内容反算相似度,相似度大于设定阈值的保留,其余剔除;得出唯一的一个管理对象名称后,用该管理对象的所有属性值与条款内容进行关键词匹配,得出识别政策。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于远光软件股份有限公司,未经远光软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010644374.2/1.html,转载请声明来源钻瓜专利网。





