[发明专利]一种面向科技服务需求的需求图谱构建方法有效
申请号: | 202110067662.0 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112765363B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 王红斌;胡永鹏;线岩团;文永华 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/253;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 昆明合盛知识产权代理事务所(普通合伙) 53210 | 代理人: | 牛林涛 |
地址: | 650000 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 科技服务 需求 图谱 构建 方法 | ||
本发明为一种面向科技服务需求的需求图谱构建方法,公开了一种基于需求文档的需求图谱构建的方法,该方法首先对非结构化需求文档利用依存语法和语义角色标注初步提取出文档里的需求三元组,然后通过人工标注的方式对于部分的需求三元组标注其意图标签,接着把人工标注好的数据进行数据预处理,转换成图结构数据,用one‑hot编码对图结构数据里面的部分信息进行特征编码,得到每个三元组的特征表示,将图结构数据和处理好的特征编码转为邻接矩阵和特征矩阵输入到准备好的两层图神经网络里面,得到一个训练好可以用来预测需求三元组标签的模型,最后将所有处理好的需求三元组构建成需求图谱进行可视化展示。
技术领域
本发明涉及一种面向科技服务需求的需求图谱构建方法,属于自然语言处理技术领域。
背景技术
知识图谱是谷歌在2012年提出一种语义网络,可以用图的展示形式来描述知识和客观世界万物之间的关联关系的一种技术。知识图谱是由边和节点组成。节点是一个概念实体,如苹果、人名、自然与语言处理,知识图谱。边则是概念实体的相关属性或者实体之间的关系,如英文名、引用等。具体领域的知识图谱构建是一项重要的功能,知识图谱的构建需要根据该领域的特点,设定一个符合该领域规范的知识图谱结构,紧接着如果数据是结构化数据,需要结合第三方数据进行知识融合,如果是半结构化或者结构化的数据,则是需要对数据进行属性抽取,关系抽取,实体抽取,从而得到该数据的三元组表示。之后对于这俩类数据都要进行指代消解和实体消歧,最后进行知识加工构建出该领域的知识图谱。知识图谱构建完成之后我们用其进行下游子任务,例如该领域的智能问答机器人,智能推荐等。
发明内容
本专利提出一种面向科技服务需求的需求图谱构建方法,该发明首先用自然语言处理的方法从需求文档中提取出需求三元组,然后对提取出的需求三元组进行人工标注,标注出需求三元组代表的意图,之后用one-hot码对需求三元组的本体进行编码,得到256维的特征,将特征保存为特征矩阵,以及根据需求三元组的关系构建邻接矩阵,将特征矩阵和邻接矩阵输入到设置好的图神经网络,得到一个可以识别需求三元组意图的模型,从而对所有需求三元组进行标注,标注后用d3.js的技术,实时构建输入的需求文档的需求图谱。
本发明的技术方案是:一种面向科技服务需求的需求图谱构建方法,其特征在于:具体的算法流程如下所示:
Step1、利用python-doc的包,读取存储在doc文件里面需求文档数据,并保存为字典格式;
Step2、加载哈工大语言技术平台工具Pyltp,读取Pyltp内cws.model等语言模型;
Step3、将Step1中处理好的数据先进行分句处理,将分句处理好的数据切分长句,冒号,分号等做切分标识,利用语义角色标注,获取主谓宾三元组,先根据语义角色标注的结果,抽取三元组。如果语义角色标注为空,则采取依存语法进行抽取;
Step4、将Step3中抽取成功的需求三元组利用python第三方包xlrd进行保存,存储到excel表格里面备用;
Step5、将excel里面的部分需求三元组进行人工标注,从excel里面信息提取需求三元组的特征,构建出需求三元组的特征矩阵与邻接矩阵;
Step6、将Step5中构建的矩阵放入到设计好的图神经网络进行训练,得到一个可以对三元组进行标注的模型;
Step7、利用训练好的模型将需求三元组全部进行标注后,构建成图谱形式并进行可视化展示;
进一步的,所述步骤Step2的具体步骤为:
Step2.1、加载哈工大语言技术平台工具Pyltp里面ltp.data,读取cws.model、pos.model、parser.model、ner.model、pisrl.model语言模型,以备用来对非结构化需求文本提取需求三元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110067662.0/2.html,转载请声明来源钻瓜专利网。