[发明专利]数据处理方法和数据处理装置在审
申请号: | 201610917225.2 | 申请日: | 2016-10-20 |
公开(公告)号: | CN107967285A | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 缪庆亮;孟遥 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 康建峰,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
技术领域
本发明的实施例涉及数据处理领域,具体地涉及可以根据语义知识库确定问题答案的数据处理方法和数据处理装置。
背景技术
这个部分提供了与本发明有关的背景信息,这不一定是现有技术。
问答系统是信息检索系统的一种高级形式。当用户用自然语言提出问题时,问答系统可以通过在语义知识库中进行检索匹配来用自然语言回答用户提出的问题。然而,随着语义知识库的快速增长,从海量的语义知识库中快速准确地寻找到问题的答案也越来越困难。
RDF(Resource Description Framework,资源描述框架)是一个典型的资源库。在传统的处理方法中,问答系统首先对自然语言问句进行句法分析和语义角色标注,从而将自然语言问句翻译为标准的查询语句,例如SPARQL(Simple Protocol And RDF Query Language,简单协议和RDF查询语言),然后根据标准的查询语句在整个资源库中寻找问题语句的答案。
在传统的处理方法中,需要对问句进行句法分析和语义角色标注,并且需要转换标准查询语句,增大了处理的难度,延长了处理的时间。进一步,在传统的处理方法中,需要根据标准的查询语句在整个资源库中寻找问题语句的答案,随着资源库的逐渐增大,搜索问题答案的时间也将越来越长。
针对以上技术问题,本发明希望提出一种方案,能够快速可靠地根据语义知识库确定问题语句的答案。
发明内容
这个部分提供了本发明的一般概要,而不是其全部范围或其全部特征的全面披露。
本发明的目的在于提供一种数据处理方法和数据处理装置,能够快速可靠地根据语义知识库确定问题语句的答案。
根据本发明的一方面,提供了一种数据处理方法,包括:基于语义知识库构建问题语句的语义图;根据所述语义图确定所述问题语句的答案类型;根据所述答案类型从所述语义图中确定候选语义子图;根据所述候选语义子图确定一个或者多个候选三元组;根据所述问题语句确定问题三元组;以及基于所述一个或者多个候选三元组中的每个候选三元组与所述问题三元组的相似度来确定所述问题语句的答案。
根据本发明的另一方面,提供了一种数据处理装置,包括:语义图构建单元,用于基于语义知识库构建问题语句的语义图;答案类型确定单元,用于根据所述语义图确定所述问题语句的答案类型;语义子图确定单元,用于根据所述答案类型从所述语义图中确定候选语义子图;候选三元组确定单元,用于根据所述候选语义子图确定一个或者多个候选三元组;问题三元组确定单元,用于根据所述问题语句确定问题三元组;以及答案确定单元,用于基于所述一个或者多个候选三元组中的每个候选三元组与所述问题三元组的相似度来确定所述问题语句的答案。
根据本发明的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本发明的数据处理方法。
根据本发明的另一方面,提供了一种机器可读存储介质,其上携带有根据本发明的程序产品。
使用根据本发明的数据处理方法和数据处理装置,将问题语句转换为问题三元组,通过问题三元组和候选三元组的相似度来确定问题的答案,无需对问题语句进行句法分析和语义角色标注,也不需要转换标准查询语句。这样一来,降低了处理的难度,提高了处理的效率,节约搜索时间。进一步,可以根据问题语句的答案类型从语义图中确定候选语义子图,并根据候选语义子图确定候选三元组,从而确定问题语句的答案。这样一来,将语义知识库中的语义图缩小到候选语义子图,无需在整个语义知识库中搜索问题的答案,大大减小了搜索的范围,从而缩短检索的时间并提高答案的准确性。综上,根据本发明的数据处理方法和数据处理装置能够快速可靠地根据语义知识库确定问题语句的答案。
这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本发明的范围。
附图说明
在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本发明的范围。在附图中:
图1示出了根据本发明的实施例的数据处理方法的流程图;
图2示出了根据本发明的实施例的数据处理方法中构建问题语句的语义图的流程图;
图3示出了根据本发明的实施例的构建的语义图的一个示例;
图4示出了根据本发明的实施例的构建的语义图的另一个示例;
图5示出了根据本发明的实施例的构建的语义图的又一个示例;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610917225.2/2.html,转载请声明来源钻瓜专利网。