[发明专利]一种上下位关系的确定方法、装置、服务器及存储介质有效
申请号: | 201810717262.8 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109086328B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 丁宇辰;时迎超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 下位 关系 确定 方法 装置 服务器 存储 介质 | ||
本发明实施例公开了一种上下位关系的确定方法、装置、服务器及存储介质。所述方法包括:获取第一上位词和所述第一上位词对应的第一下位词集合以及第二上位词和所述第二上位词对应的第二下位词集合;确定所述第一下位词集合与所述第二下位词集合的包含关系;根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系。上下位关系更加饱满,泛化性较强,能够满足用户实体问答的需求。
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种上下位关系的确定方法、装置、服务器及存储介质。
背景技术
上下位关系是一种基本的语义关系,常用于本体、知识库、词典的构建和验证。从技术实现的角度来看,上下位关系获取为其他信息的获取提供了重要支持。实体的上位词是对具有共同特性的一类实体的概括,例如“红色”、“黄色”、“绿色”的上位词是“颜色”,“轿车”、“卡车”的上位词是“汽车”。有了这种上下位关系作为先验知识,就可以快速地缩小实体答案的范围,有助于实体问答算法快速、准确地找出答案。例如,对于问题“天空是什么颜色的?”,在寻找答案的过程中,通常会先分析出问题的需求是“颜色”,之后借助实体上下位关系,可以快速地筛除上位词不是“颜色”的实体,将注意力集中在少量候选之上,甚至直接得到答案。
现有的上下位关系的确定方法,通常是在问答数据中统计各个实体词共同出现的频次;当若干个实体词共同出现的频次较高时,则认为这些实体词存在上下位关系。例如,当问题中出现实体词“颜色”时,答案中经常出现“红色”和“黄色”,则认为“红色”和“黄色”的上位词是“颜色”。将所有实体的上下位关系整理在一起,便可以得到上下位体系。
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:
现有的上下位关系的确定方法,上下位关系单一,泛化性较弱,无法满足实体问答的需求。例如,对于“日本有哪些有名的景点?”的问题,答案大多包含“北海道”,采用现有的上下位关系的确定方法,可以得到“北海道”与“景点”的上下位关系,但是没有得到“北海道”与“地区”的上下位关系,因此,当遇到问题“日本有哪些地区?”时,答案“北海道”则会被忽略掉。
发明内容
有鉴于此,本发明实施例提供一种上下位关系的确定方法、装置、服务器及存储介质,上下位关系更加饱满,泛化性较强,能够满足用户实体问答的需求。
第一方面,本发明实施例提供了一种上下位关系的确定方法,所述方法包括:
获取第一上位词和所述第一上位词对应的第一下位词集合以及第二上位词和所述第二上位词对应的第二下位词集合;
确定所述第一下位词集合与所述第二下位词集合的包含关系;
根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系。
在上述实施例中,所述确定所述第一下位词集合与所述第二下位词集合的包含关系,包括:
若所述第一下位词集合为所述第二下位词集合的真子集,则确定所述第一下位词集合与所述第二下位词集合的包含关系为第一包含关系;
或者,若所述第二下位词集合为所述第一下位词集合的真子集,则确定所述第一下位词集合与所述第二下位词集合的包含关系为第二包含关系。
在上述实施例中,所述根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系,包括:
若所述第一下位词集合与所述第二下位词集合的包含关系为第一包含关系,则所述第一上位词与所述第二上位词的上下位关系为所述第一上位词为所述第二上位词的下位词;所述第二上位词为所述第一上位词的上位词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810717262.8/2.html,转载请声明来源钻瓜专利网。