[发明专利]一种基于LDA跨域的构建服务知识图谱实现服务组合优化的方法及系统有效
申请号: | 202110474463.1 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113342988B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 戴鸿君;李秀萍 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06F40/289;G06F40/30 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lda 构建 服务 知识 图谱 实现 组合 优化 方法 系统 | ||
1.一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,包括步骤如下:
(1)抓取服务数据:抓取服务描述信息,对服务描述信息进行分词处理,并对服务描述信息根据不同服务固有的类别进行领域划分;
(2)处理语义信息:使用自然语言处理技术,对服务描述信息和领域标签信息进行处理,是指:依据不同领域的标签信息,对响应的服务描述信息进行修正,使得不同领域的服务在保持原有特性的基础上,和相近领域的服务保持关联;
(3)构建语义本体库;通过对WSDL文件以及服务描述信息的语义提取,将语义信息转化为语义本体描述存入语义本体库;
(4)构建知识图谱:抽取服务即实体以及实体之间的关系,以csv格式导入Neo4j数据库中;
(5)服务组合优化:基于已构建的知识图谱,构建自适应性深度强化学习组合网络,基于自适应性深度强化学习组合网络深度强化学习优化服务组合;
服务组合优化,包括步骤如下:
构建自适应性深度强化学习组合网络,所述自适应性深度强化学习组合网络包括输入层、隐藏层、全连接层及输出层;将服务以及与其邻接的所有输出关系作为状态-动作对输入自适应性深度强化学习组合网络中输入层后,经过多个长短期记忆单元组成的一个隐藏层和一个全连接层的非线程变换,输出每个状态-动作对的Q值,最终得到一个具有最大化累计反馈值的服务序列,即实现了服务组合优化。
2.根据权利要求1所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,步骤(2)中,处理语义信息,包括步骤如下:
a、使用隐含狄利克雷分布分析服务描述信息和地理位置信息;
使用隐含狄利克雷分布用来计算每个服务相近的主题模型,并将服务描述信息投影映射到由多个主题组成的向量空间,其中,领域标签信息经过独热编码被视为特殊的词汇,该特殊的词汇以出现的频率被添加到服务描述信息中去;
被添加的Top-N词汇l在形式上满足如下式(Ⅰ):
式(Ⅰ)中,γ系数由公式确定,ω、η、δ都是在程序中手动设定的参数,用以限制γ的范围,li是指文档中出现的不同词语在该文档中的频率;fwd是指文档中出现的不同词语在全部语料库中的频率;fl是不同服务的Top-N地理位置计数频率;
b、使用吉布斯采样进行近似处理,具体是指:输入服务描述d、参数α和β、主题数目K、地理位置信息l,参数α和β是在隐含狄利克雷分布中所需要的参数,进行服务语义建模,在服务语义建模之后,获得文档-主题概率分布矩阵φ和主题-词语概率分布矩阵Θ。
3.根据权利要求2所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,步骤b的具体实现过程包括:
c、对Top-N词汇l使用聚类算法聚类并进行过滤,将Top-N词汇l以步骤a所述的以出现的频率添加相应的服务描述信息中去;
d、初始化列统计变量,对语料库每个词进行吉布斯采样,采样主题词,并赋予每一个服务描述文档可能的主题词,不断进行收敛与更新,直至获取到最终的主题词共现频率矩阵;
e、统计语料库的主题词汇共现频率矩阵,获取到服从多项式分布的主题-词语概率分布矩阵Θ和文档-主题概率分布矩阵φ。
4.根据权利要求1所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,步骤(3)中,构建语义本体库,包括步骤如下:
f、如果语义本体库中的服务无服务描述信息,则自动生成服务描述信息,进入步骤g;否则,结束;
g、导入服务描述信息,存储服务的服务描述信息,既得语义本体库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110474463.1/1.html,转载请声明来源钻瓜专利网。