[发明专利]一种建筑工程变更指令的分类方法有效

专利信息
申请号: 202011629638.3 申请日: 2020-12-30
公开(公告)号: CN112749278B 公开(公告)日: 2022-10-18
发明(设计)人: 刘发贵;吴怡 申请(专利权)人: 华南理工大学;广东筑物智联科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/211;G06F40/289;G06F40/295;G06F40/30;G06K9/62
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 江裕强
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 建筑工程 变更 指令 分类 方法
【权利要求书】:

1.一种建筑工程变更指令的分类方法,其特征在于,包括以下步骤:

S1、针对建筑工程文档的特点,进行文档转换处理,提取每份文档的正文内容,并标注每份文档所属类别,建立建筑工程语料库;

S2、构建建筑领域词典,通过分词工具结合建筑领域词典对建筑工程语料库中的文本进行分词预处理,得到文本词序列;

S3、建立词向量训练语料,采用词向量模型训练分布式词向量;具体包括:

S3.1、建立词向量训练语料,其中包括步骤S1建立的建筑工程语料库中的语料、wiki百科中文语料,和建筑行业相关现行国家标准,再基于步骤S2建立的建筑领域词典进行分词预处理;

S3.2、采用词向量模型对上述语料进行训练,得到分布式词向量;

S4、基于分布式方法表示文本的全局词特征和局部句法特征,构建文本融合语义表示;包括以下步骤:

S4.1、使用分布式词向量表示文本全局词特征,得到文本全局语义表示Cg;步骤S4.1的具体步骤如下:

S4.1.1、使用步骤S3.2中分布式词向量表示文本词序列,得到文本词向量矩阵,即X={x1,x2,…,xm},其中m为文本词序列中词的个数,xi表示第i个词的词向量,i的范围为1~m;

S4.1.2、计算词序列维度平均得到文本全局语义表示:

S4.2、使用分布式词向量表示文本局部句法特征,得到文本局部语义表示Cl;步骤S4.2的具体步骤如下:

S4.2.1、利用依存分析工具识别每份文本的文本词序列中各个词之间的依存关系,形成一个以谓语动词为根结点,其他词作为子结点直接或间接地依存于根结点的依存关系结构;

S4.2.2、利用句子的依存关系结构,首先抽取出根结点及其主谓关系、动宾关系依存弧上的受支配词,然后将与根结点具有并列关系的动词分别作为父结点,抽取出该父结点及其主谓关系、动宾关系依存弧上的受支配词,最后将所有抽取的词以原顺序排列作为文本句法特征;

S4.2.3、使用步骤S3.2中分布式词向量表示步骤S4.3.2中抽取的句法特征,得到每份文本句法特征词向量矩阵,即其中n为抽取的句法特征词数量,表示第j个句法特征词的词向量,j的范围为1~n;

S4.2.4、动词在句子中处于支配地位,建立其他词之间的连接关系,从语义上看,存在一类描述对动宾关系依存弧上受支配词进行状态改变的动作,即涉及建筑工程变更指令,称之为变更触发词;构建基于变更触发词词典的注意力,计算文本句法特征词与变更触发词的关联度αj,j的范围为1~n,进而得到文本局部语义表示:

具体步骤如下:

S4.2.4.1、收集建筑工程语料库文本中描述工程变更的动词,建立变更触发词词典;

S4.2.4.2、基于中文同义词库,查找与步骤S4.2.4.1中变更触发词词典中的每个动词相似度最大的5个词,扩充变更触发词词典;

S4.2.4.3、使用步骤S3.2中的分布式词向量,将变更触发词词典中每个词表示为词向量,并分别作为键向量,文本句法特征词向量矩阵中的每一词向量作为查询向量,计算该句法特征词与触发词之间的关联度,增强语义更接近表示状态变化的词的权重;注意力得分采用点积法计算,即:

其中,为变更触发词词典中第k个词的词向量;

取该句法特征词与变更触发词词典中所有词的注意力得分的最大值为基于变更触发词词典的注意力,即:

对应的该句法特征词基于变更触发词词典的注意力权重为:

S4.3、以拼接方式合并步骤S4.1中的文本全局语义表示和步骤S4.2中的文本局部语义表示,得到文本融合语义表示:

S5、基于步骤S4中得到的文本融合语义表示,采用监督机器学习算法构建分类模型;对待分类文档进行预测,快速获取其中涉及工程变更的指令。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广东筑物智联科技有限公司,未经华南理工大学;广东筑物智联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011629638.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top