[发明专利]一种藏文知识库的表示方法在审
| 申请号: | 201910502622.7 | 申请日: | 2019-06-11 |
| 公开(公告)号: | CN111008186A | 公开(公告)日: | 2020-04-14 |
| 发明(设计)人: | 孙媛;夏天赐 | 申请(专利权)人: | 中央民族大学 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06N3/04;G06N3/08 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
| 地址: | 100081 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 藏文 知识库 表示 方法 | ||
本发明涉及一种藏文知识库的表示方法,该方法包括以下步骤:通过卷积神经网络学习知识库中实体的描述性表示,再利用TransE算法学习知识库中实体的结构性表示,最后将两种表示进行融合训练,得到知识库的最终表示。本发明能够在尽可能抽取高质量的文本信息的同时,减少模型复杂度与需要训练的参数量,最终建立更好的实体基于描述的知识表示。
技术领域
本发明涉及知识库的表示技术,尤其涉及一种藏文知识库的表示方法。
背景技术
知识库是推动人工智能学科发展和支撑智能信息服务应用(如智能搜索、智能问答、个性化服推荐等)的重要基础技术。为了改进信息服务质量,国内外互联网公司(特别是搜索引擎公司)纷纷推出知识库产品,如谷歌知识图谱、微软 Bing Satori、百度知心以及搜狗知立方等。
知识库的研究目标是从无结构或半结构的互联网信息中自动抽取结构化知识。有了知识库的支撑,当我们搜索“中国的人口”、“法国的首都”时,谷歌、百度可以直接给出答案,并给出相关的知识链接。知识表示通过将实体或关系投影到低维向量空间,实现对实体和关系的语义信息表示,进而高效地计算实体、关系及其之间的复杂语义关联。
由于中英文的知识库信息较为丰富,比如Freebase包含了数亿的三元组,通过传统的网络表示学习(TransE、TransH等方法)对其进行表示学习会得到每个实体的丰富信息特征。而藏文知识库数据稀疏,单纯使用网络学习表示方法无法很好的表达出每个实体的语义特征。因此,如何进行藏文知识库的表示学习,对藏文信息处理研究具有重要意义。
发明内容
本发明的目的在于,针对藏文知识库数据稀疏,无法充分对知识库进行表示学习的问题,利用已有的藏文知识库和藏文百科文本,通过卷积神经网络学习知识库中实体的描述性表示,再利用TransE算法学习知识库中实体的结构性表示,最后将两种表示进行融合训练,得到知识库的最终表示。
为实现上述目的,本发明提供了一种藏文知识库的表示方法,该方法包括以下步骤:
描述性表示,利用卷积神经网络对实体描述信息进行建模,联合藏文百科知识和知识库知识共同训练,得到实体的共现矩阵;
结构性表示,利用TransE算法对实体内部进行学习建模;
融合表示学习,将描述性表示和结构性表示映射到同一向量空间中,使用改进的能量函数,在训练中采用平移模型的学习框架,利用最大间隔方法,定义评分函数对模型进行优化,得到藏文知识库的最终表示。
本发明能够在尽可能抽取高质量的文本信息的同时,减少模型复杂度与需要训练的参数量,最终建立更好的实体基于描述的知识表示。
附图说明
图1为一种藏文知识库的表示方法流程示意图;
图2为一种藏文知识库的表示方法整体框架;
图3为一种藏文知识库的表示方法描述性表示。
具体实施例
图1为一种藏文知识库的表示方法流程示意图。如图1所示,该方法包括步骤S101-S103:
步骤S101,描述性表示,利用卷积神经网络对实体描述信息进行建模,联合藏文百科知识和知识库知识共同训练,得到实体的共现矩阵;
具体地,卷积层是卷积神经网络的核心操作,由于在融合实体描述的知识表示任务中,处理对象是文本序列,使用一组长度为的一维卷积核。形式化地,使用X(l)表示第l层输入序列的矩阵,Z(l)表示第l层输出矩阵。其中,实体经过预处理后的描述序列X={x1,x2,L,xn}即为第一层卷积层的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中央民族大学,未经中央民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910502622.7/2.html,转载请声明来源钻瓜专利网。





