[发明专利]一种基于超节点的常识语义图谱构建方法和装置以及基于连接预测的常识补全方法在审
申请号: | 201810320164.0 | 申请日: | 2018-04-11 |
公开(公告)号: | CN108846000A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 沈琼;朱嘉奇;王宏安 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 超节点 方法和装置 图谱构建 语义关系 语义网络 预测 短语 常识知识 关联关系 人工编辑 辅助的 复杂度 词语 图谱 集合 提炼 自动化 涵盖 检验 网络 发现 | ||
1.一种基于超节点的常识语义图谱构建方法,其特征在于,包括以下步骤:
1)建立超节点,所述超节点代表一个概念或者实体,由一组同义词集合来表示;
2)建立语义关系,所述语义关系表示概念或实体之间的关联关系;
3)设置常识的属性,所述属性包括常识的置信度和常识检索的频率;
4)由所述超节点、所述语义关系和所述属性构成常识语义图谱,所述超节点之间以语义关系为边来连接,所述属性附属在所述边上。
2.如权利要求1所述的方法,其特征在于,所述同义词集合内的同义词无序,或者根据同义词在某个技术领域出现的频率来排序。
3.如权利要求1所述的方法,其特征在于,所述同义词集合内的同义词是中文的一个词语,或者是一个中文短语。
4.如权利要求1所述的方法,其特征在于,所述关联关系包括:
a)因果关系,若一个概念导致了另一个概念的产生,则概念与其概念之间为因果关系;
b)隶属关系,若一个概念是另外一个概念涵义的子集,则两者之间的关系即为隶属关系;
c)位置关系,若一个概念和另一个概念是空间的联系,则两者之间的关系即为位置关系;
d)动机关系,若一个概念主动或者被动地和另一个联系,则两者之间的关系即为动机关系;
e)属性关系,若一个概念揭示了另一个概念的性质,则两者之间的关系即为属性关系;
f)词源关系,若一个概念和另一个概念产生词关联,则两者之间的关系即为词源关系;
g)顺序关系,若一个概念和另一个概念的出现有先后,则两者之间的关系即为顺序关系;
h)血缘关系,若一个概念和另一个概念有血亲联系,则两者之间的关系即为血缘关系;
i)时间关系,若一个概念和另一个概念是时间上的联系,则两者之间的关系即为时间关系;
j)实例关系,若一个概念是另一个的实例化表示,则两者之间的关系即为实例关系。
k)使能关系,若两个概念之间有主动或者被动的支配关系,则两者的关系即为使能关系。
5.如权利要求1所述的方法,其特征在于,所述置信度衡量常识的准确性,所述置信度根据常识的来源确定,越可靠的来源置信度值越大。
6.如权利要求1所述的方法,其特征在于,所述频率是索引构建的依据,频率初始设置为0,根据常识被检索的频次而动态增加,当达到一定的频率阈值后,设置单独的索引来提高检索速度。
7.如权利要求6所述的方法,其特征在于,通过经验设定所述频率阈值。
8.一种基于超节点的常识语义图谱构建装置,其特征在于,包括:
超节点建立模块,负责建立超节点,所述超节点代表一个概念或者实体,由一组同义词集合来表示;
语义关系建立模块,负责建立语义关系,所述语义关系表示概念或实体之间的关联关系;
属性设置模块,负责设置常识的属性,所述属性包括常识的置信度和常识检索的频率;
图谱建立模块,负责由所述超节点、所述语义关系和所述属性构成常识语义图谱,所述超节点之间以语义关系为边来连接,所述属性附属在所述边上。
9.一种基于连接预测的常识补全方法,其特征在于,包括以下步骤:
a)由采用权利要求1至7中任一权利要求所述方法建立的常识图谱构成常识库,常识库的检索接口增加日志功能,记录每次检索未召回的概念;
b)以所述未召回的概念为头节点,利用推理模型在不同关系中进行预测,得到尾节点,或者以所述未召回的概念为尾节点,利用推理模型在不同关系中进行预测,得到头结点,取得分最高的为预测结果;
c)每隔一个固定周期进行批量推理预测,再批量地更新常识,从而不断地补充新常识,完善常识库。
10.如权利要求9所述的方法,其特征在于,所述推理模型采用语义嵌入模型,对常识知识进行向量化表示,所述向量化表示采用低纬稠密向量,在保留语义信息的同时方便进行语义计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810320164.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多尺度区域特征比对的商标图像检索方法
- 下一篇:菜谱推荐的方法和装置