[发明专利]一种基于公共语义空间学习构建图文知识图谱方法有效
申请号: | 202110208342.2 | 申请日: | 2021-02-24 |
公开(公告)号: | CN112818135B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 曾焕强;刘晓庆;廖昀;张联昌;冯万健;王华虎 | 申请(专利权)人: | 华侨大学;厦门亿联网络技术股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06V10/80;G06V10/82;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;王婷婷 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 公共 语义 空间 学习 构建 图文 知识 图谱 方法 | ||
1.一种基于公共语义空间学习构建图文知识图谱方法,其特征在于,包括如下步骤:
S10:构建深度神经网络用于图像与文本数据的深度特征提取;
S20:将图像与文本数据对oi=(xi,li,yi)分别输入到深度神经网络中训练;其中oi表示第i对图像-文本数据对 以及对应的标签,xi,yi与li分别表示第i个图像数据、文本数据以及对应的标签数据;通过损失函数学习两种图像和文本数据间的公共语义表达,并将图像与文本特征转化到公共语义空间中;具体为:
S201:将图像与文本数据对oi=(xi,li,yi)分别输入到深度神经网络中训练,通过神经网络的学习将图像与文本特征转化到一个公共语义空间中,其中oi表示第i对图像-文本数据对以及对应的标签,xi,yi与li分别表示第i个图像数据,文本数据以及对应的标签数据;
S202:将输入的图像数据集输入到图像特征提取网络,其中xi表示第i张图像数据,一共有n张图像;在经过全卷积网络FCN后对图像进行像素级分类,将图像的内容分为背景信息bX1与主体目标信息mX1,使用FCN-16s模型作为图像分割网络;
S203:将在步骤S202中图像分离的背景信息bX1,通过一个卷积网络,采用VGG-16,并且最后一层的全连接输出长度为e1,通过全连接网络后得到背景信息的高级特征信息bX2,长度为e1;
S204:主体目标信息mX1经过一个卷积网络后得到的高级语义特征为mX2,并通过两层全连接网络所输出的特征,分别对应的特征为mX3与mX4,其中,mX3与mX4分别对应图像侧的神经网络中倒数第3层与倒数第2层的全连接输出,mX4的特征长度为e1,并将bX2与mX4进行特征融合,输入到最后一层全连接层中得到iF,融合公式如下:
iF=α1mX4+β1bX2
其中α1+β1=1,α1>β1,α1=0.8,β1=0.2;
S205:在文本侧网络中,将文本数据集中内容使用语义角色标注,其中,m为文本数据量,将文本数据中的“施事”与“受事”角色,生成文本侧的主体目标向量mY1,其他角色词作为辅助信息词向量bY1;
S206:将标注好不同角色的词分别使用的是Glove模型,并使用Google News数据集在模型上进行预训练,将生成的词向量mY1与bY1分别输入到独立的全连接网络中;主体目标信息mY1经过一个卷积网络后得到的文本信息的高级语义特征为mY2,并通过两层全连接网络所输出的特征,分别对应的特征为mY3与mY4,其中,mY3与mY4分别对应文本侧的神经网络中倒数第3层与倒数第2层的全连接输出,并将bY1经过一个全连接层的输出bY2与mX4进行特征融合,输入到最后一层全连接层中得到tF,融合公式为tF=α2mY4+β2bY2,其中α2+β2=1,α2>β2,α2=0.8,β2=0.2;
S207:标签数据通过一层全连接网络生成自监督的高级标签语义信息;在最后两层全连接网络所输出的语义信息分别为L1和L2;
S208:计算损失值,并通过训练缩小损失值,得到训练好的深度神经网络模型;
S30:根据相似度度量,依据CN-DBpedia的构建方法构建知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学;厦门亿联网络技术股份有限公司,未经华侨大学;厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110208342.2/1.html,转载请声明来源钻瓜专利网。