[发明专利]一种基于神经网络的需求文档和服务文档匹配方法在审

申请号：	201810217155.9	申请日：	2018-03-16
公开（公告）号：	CN108595409A	公开（公告）日：	2018-09-28
发明（设计）人：	邹祥文;吴悦	申请（专利权）人：	上海大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06F17/30;G06N3/04;G06N3/08
代理公司：	上海上大专利事务所(普通合伙) 31205	代理人：	顾勇华
地址：	200444***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	服务文档需求文档神经网络相似度文档分割匹配记忆神经网络卷积神经网络计算相似度文档转化向量加权嵌入文本
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于神经网络的需求文档和服务文档匹配方法，其特征在于操作步骤如下：

步骤1：输入一篇需求文档和一篇服务文档作为待匹配文档，需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标，服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划；

步骤2：根据文档内容判断输入文档是需求文档或服务文档；

步骤2.1：包括企业需要解决的问题以及解决该问题时需要达到的指标部分则是需求文档，提取企业需要解决的问题以及解决该问题时需要达到的指标部分；

步骤2.2：包括概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分则是服务文档，提取概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分；

步骤2.3：最终的需求文档和服务文档的相似度要对所有需求文档提取部分与所有服务文档提取部分计算相似度，以下取需求文档的需要解决的问题和服务文档的概述解决该难题技术的方法为例；

步骤3：对需求文档的需要解决的问题部分和服务文档的概述解决该难题技术的方法部分中的句子进行段落嵌入处理，获得句子向量；

步骤4：通过长短期记忆网络判断文档分割点；

步骤4.1：将获得的句子向量输入训练好的长短期记忆网络中，由长短期记忆网络输出结果判断前一句子是否是一个分割点；

步骤4.2：根据分割点将一个部分分割成意思不同的几段文本，对需求文档的问题部分就是一个个需求，服务文档的解决部分就是一个个方法。

步骤5：根据处理结果类型构造相似度模型输入；

步骤5.1：如果是需求文档，则将一个需求的所有句子通过PE模型处理后得到句子向量构成一个矩阵，同时取一个方法的所有句子向量构成另一个矩阵；

步骤5.2：如果是服务文档，则将一个方法的所有句子通过PE模型处理后得到句子向量构成一个矩阵，同时取一个需求的所有句子向量构成另一个矩阵；

步骤6：将两个矩阵作为输入通过训练好的卷积神经网络计算相似度，每个需求交叉的和每个方法计算相似度，对每个需求取相似度最大的值作为这一需求的最终值；

步骤7：对相似度值加权平均获得最终相似度；

步骤7.1：获取每个需求最终值后求加权平均值作为需求文档的需要解决的问题最终相似度值；

步骤7.2：上述步骤以需求文档的需要解决的问题和服务文档的概述解决该难题技术的方法为例，需求文档包含需要解决的问题以及解决该问题时需要达到的指标部分，根据上述方法再求得需求文档解决该问题时需要达到的指标部分相似度，求两部分加权平均值作为需求文档和服务文档最终相似度；