[发明专利]一种基于神经网络的需求文档和服务文档匹配方法在审
| 申请号: | 201810217155.9 | 申请日: | 2018-03-16 | 
| 公开(公告)号: | CN108595409A | 公开(公告)日: | 2018-09-28 | 
| 发明(设计)人: | 邹祥文;吴悦 | 申请(专利权)人: | 上海大学 | 
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/04;G06N3/08 | 
| 代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 顾勇华 | 
| 地址: | 200444*** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 服务文档 需求文档 神经网络 相似度 文档 分割 匹配 记忆神经网络 卷积神经网络 计算相似度 文档转化 向量 加权 嵌入 文本 | ||
本发明涉及一种基于神经网络的需求文档和服务文档匹配方法。本发明利用需求文档和服务文档结构,通过对文档进行提取,利用段落嵌入将文档转化为向量,通过长短期记忆神经网络对文章进行分割,在分割文本上利用卷积神经网络计算相似度,求得所有分割文档的相似度后计算加权平均值;最终得到需求文档和服务文档的相似度。
技术领域
本发明涉及计算机自然语言处理领域,主要针对于需求文档和服务文档的匹配,具体涉及一种基于神经网络的需求文档和服务文档匹配方法。
背景技术
随着互联网迅速发展和普及,现代企业生产方式变成以技术为基础的互相协作。为了寻找相互协作的企业,需求方编写符合企业需求的需求文档,而技术方编写企业技术能力对应的服务文档,通过连接互联网,加快发现协作企业,减少企业时间和人力成本。
企业需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标,企业服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划。如何通过需求文档和服务文档快速为企业寻找合作伙伴成为当下一个热点和难点。
目前常用的文档匹配方法通过将文本转化为文档向量空间模型(Vector SpaceModel,VSM),在逆文档频率(Term Frequency–Inverse Document Frequency Model,TF-IDF)模型的基础上通过距离函数计算两个文档的相似度,距离越小就越相似。由于需求文档可能会包含需要合作企业同时满足的几项需求,而服务文档可能会列举企业目前能够最大程度提供的技术服务,服务文档需要满足需求文档中绝大多数或者全部的情况下才是正确的匹配,目前的匹配方法在这方面还存在不足。
发明内容
为了克服目前的匹配方法在需求文档和服务文档匹配上的不足,提高需求文档和服务文档匹配的准确率,本发明提出了一种基于神经网络的需求文档和服务文档匹配方法,利用需求文档和服务文档的内容的特殊性,提取文档内容,在更细粒度进行匹配,最后综合得出匹配结果。
为达到上述目的,本发明采用下述技术方案:
步骤1:输入一篇需求文档和一篇服务文档作为待匹配文档,需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标,服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划;
步骤2:根据文档内容判断输入文档是需求文档或服务文档;
步骤2.1:包括企业需要解决的问题以及解决该问题时需要达到的指标部分则是需求文档,提取企业需要解决的问题以及解决该问题时需要达到的指标部分;
步骤2.2:包括概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分则是服务文档,提取概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分;
步骤2.3:最终的需求文档和服务文档的相似度要对所有需求文档提取部分与所有服务文档提取部分计算相似度,以下取需求文档的需要解决的问题和服务文档的概述解决该难题技术的方法为例;
步骤3:对需求文档的需要解决的问题部分和服务文档的概述解决该难题技术的方法部分中的句子进行段落嵌入(Paragraph Embedding,PE)处理,获得句子向量;
步骤4:通过长短期记忆网络(Long Short-Term Memory,LSTM)判断文档分割点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810217155.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于端到端神经网络的指代消解方法
 - 下一篇:手写作文的自动批改方法及装置
 





