[发明专利]一种基于神经网络的需求文档和服务文档匹配方法在审
| 申请号: | 201810217155.9 | 申请日: | 2018-03-16 |
| 公开(公告)号: | CN108595409A | 公开(公告)日: | 2018-09-28 |
| 发明(设计)人: | 邹祥文;吴悦 | 申请(专利权)人: | 上海大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/04;G06N3/08 |
| 代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 顾勇华 |
| 地址: | 200444*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 服务文档 需求文档 神经网络 相似度 文档 分割 匹配 记忆神经网络 卷积神经网络 计算相似度 文档转化 向量 加权 嵌入 文本 | ||
1.一种基于神经网络的需求文档和服务文档匹配方法,其特征在于操作步骤如下:
步骤1:输入一篇需求文档和一篇服务文档作为待匹配文档,需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标,服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划;
步骤2:根据文档内容判断输入文档是需求文档或服务文档;
步骤2.1:包括企业需要解决的问题以及解决该问题时需要达到的指标部分则是需求文档,提取企业需要解决的问题以及解决该问题时需要达到的指标部分;
步骤2.2:包括概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分则是服务文档,提取概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分;
步骤2.3:最终的需求文档和服务文档的相似度要对所有需求文档提取部分与所有服务文档提取部分计算相似度,以下取需求文档的需要解决的问题和服务文档的概述解决该难题技术的方法为例;
步骤3:对需求文档的需要解决的问题部分和服务文档的概述解决该难题技术的方法部分中的句子进行段落嵌入处理,获得句子向量;
步骤4:通过长短期记忆网络判断文档分割点;
步骤4.1:将获得的句子向量输入训练好的长短期记忆网络中,由长短期记忆网络输出结果判断前一句子是否是一个分割点;
步骤4.2:根据分割点将一个部分分割成意思不同的几段文本,对需求文档的问题部分就是一个个需求,服务文档的解决部分就是一个个方法。
步骤5:根据处理结果类型构造相似度模型输入;
步骤5.1:如果是需求文档,则将一个需求的所有句子通过PE模型处理后得到句子向量构成一个矩阵,同时取一个方法的所有句子向量构成另一个矩阵;
步骤5.2:如果是服务文档,则将一个方法的所有句子通过PE模型处理后得到句子向量构成一个矩阵,同时取一个需求的所有句子向量构成另一个矩阵;
步骤6:将两个矩阵作为输入通过训练好的卷积神经网络计算相似度,每个需求交叉的和每个方法计算相似度,对每个需求取相似度最大的值作为这一需求的最终值;
步骤7:对相似度值加权平均获得最终相似度;
步骤7.1:获取每个需求最终值后求加权平均值作为需求文档的需要解决的问题最终相似度值;
步骤7.2:上述步骤以需求文档的需要解决的问题和服务文档的概述解决该难题技术的方法为例,需求文档包含需要解决的问题以及解决该问题时需要达到的指标部分,根据上述方法再求得需求文档解决该问题时需要达到的指标部分相似度,求两部分加权平均值作为需求文档和服务文档最终相似度;
步骤8:最终相似度和预设阈值相比较,大于阈值则两篇文档匹配,小于阈值则两篇文档不匹配。
2.根据权利要求1所述的基于神经网络的需求文档和服务文档匹配方法,其特征在于:
所述步骤4中的分割点是指文档的前一句和后一句所述意思不相同,则前一句是一个分割点。所述的长短期记忆网络的历史信息更新公式为:
Ct=0(when hr-1→1)
其中Ct时长短期记忆网络t时刻的历史信息,ht-1是上一个状态的输出,判断是否是分割点;
更新历史信息时,如果前一时间得到的输出是分割点,则将Ct更新为0,不是分割点则不处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810217155.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于端到端神经网络的指代消解方法
- 下一篇:手写作文的自动批改方法及装置





