[发明专利]建设行业工程量计价清单数据自动编码与识别方法及系统有效
| 申请号: | 201710117033.8 | 申请日: | 2017-03-01 |
| 公开(公告)号: | CN106934536B | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 陈林淇;罗杰锋;陈玉辉;陈文妮;胡焱;张涛;侯晓峰;陈红仙;詹宇清;陈汝炫;欧迅;陈文 | 申请(专利权)人: | 广东中建普联科技股份有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/08 |
| 代理公司: | 北京市盈科律师事务所 11344 | 代理人: | 江锦利 |
| 地址: | 510000 广东省广州市广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 建设 行业 工程量 计价 清单 数据 自动 编码 识别 方法 系统 | ||
本发明涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统,其能够将人类自然语言描述的计价清单数据进行智能识别、统一标准编码及自动归集,经过处理后的计价清单数据将具有唯一对应的编码,可实现智能识别、转换、分析、归类、统计等功能的自动化,无需人工操作,有助于提高工作效率,降低企业成本,更快推进建设工程项目的投资分析以及全过程造价管理。
技术领域
本发明属于建设行业工程数据分析领域,具体涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统。
背景技术
在建设行业,各个企业要实现建设工程项目的全过程管理,需要对海量的工程项目数据(例如工程量计价清单数据)进行对比、分析、预警、总结等等。各省份所采用的清单计价规范偏差较大,或者采用不同版本的清单计价规范,编码不统一,工程项目数据难以在计算机系统中统一识别和调用,通常只能靠人工经验进行判断,效率低、成本高,准确性差。导致在建设工程项目全过程管理中无法准确有效的进行成本管控和预警。
发明内容
本发明针对现有技术中计价清单数据难以识别、分析所导致的效率低以及成本高等问题,提出一种建设行业工程量计价清单数据自动编码与识别方法,同时相应提出一种建设行业工程量计价清单数据自动编码与识别系统的结构方案。
本发明提出的一种建设行业工程量计价清单数据自动编码与识别方法,主要包括以下步骤A1至步骤A6:
A1、获取计价清单数据,根据统一的标准清单编码规范对所述计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;
A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;
A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;
A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;
A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;
A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
本发明的一优选方案中,所述步骤A1之前还包括:
A0、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应。
本发明的一优选方案中,所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。当然,标准清单编码及各层级的位数可根据具体情况设置。
本发明的一优选方案中,所述步骤A3中预置关键词规则库的方法包括:
A31、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词;
A32、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库;
A33、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。
本发明的一优选方案中,所述步骤A4包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东中建普联科技股份有限公司,未经广东中建普联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710117033.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





