[发明专利]处理问答语料的方法、装置及电子终端在审
申请号: | 201811180272.9 | 申请日: | 2018-10-10 |
公开(公告)号: | CN109388697A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 廖宇康;江岭 | 申请(专利权)人: | 成都小多科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预处理 电子终端 答案 语料 匹配 知识库 判定结果 人为因素 冗余数据 问答服务 用户提供 问答库 语料库 去除 遗漏 智能 | ||
本发明实施例提供一种处理问答语料的方法、装置及电子终端,所述方法包括:根据语料库构造多个第一问答对;去除所述第一问答对中的问题、答案中的冗余数据得到预处理后的问答对;判断经过预处理的问题与答案是否匹配;若是,将判定结果为匹配的问题和答案构造为第二问答对,并将所述第二问答对存入问答库中。以此可以解决由于人为因素过多带来的知识遗漏、效率低的问题,并能够提高问答知识库的质量,从而向用户提供高质量的智能问答服务。
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种处理问答语料的方法、装置及电子终端。
背景技术
智能问答系统是一种利用计算机自动回答用户所提出的问题以满足用户知识需求的软件系统。智能问答系统在工作过程中依赖于一个包含大量问答对的问答知识库。
当智能问答系统接收到用户所提出的问题后,系统会利用信息检索、意图识别、语义解析、语义匹配等一系列技术手段,基于问答知识库选取出合适的答案返回给用户。目前,构建问答知识库的方法主要依赖于人工操作,人工操作效率低,难以提高问答知识库的质量。
发明内容
有鉴于此,本发明实施例的目的在于提供一种处理问答语料的方法、装置及电子终端。
第一方面,本发明实施例提供一种处理问答语料的方法,包括:
根据语料库构造多个第一问答对;
分别对所述第一问答对中的问题、答案进行预处理;
判断经过预处理的问题与答案是否匹配;
若是,将判定结果为匹配的问题和答案构造为第二问答对,并将所述第二问答对存入问答库中。
第二方面,本发明实施例提供一种处理问答语料的装置,所述装置包括:
第一构造模块,用于根据语料库构造第一问答对;
预处理模块,用于分别对所述第一问答对中的问题、答案进行预处理;
判断模块,用于判断经过预处理的问题与答案是否匹配;
第二构造模块,用于将判定结果为匹配的问题和答案构造为第二问答对,并将所述第二问答对存入问答库中。
第三方面,本发明实施例提供一种电子终端,包括:
存储器;
处理器;
所述存储器用于存储支持处理器执行上述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
与现有技术相比,本发明实施例的处理问答语料的方法、装置及电子终端,可以通过从含有大量人工应答记录的语料库中构造出多个第一问答对。在得到第一问答对后,对问答对中的问题、答案进行预处理可以提高数据处理效率,例如,可以对问题、答案中的冗余信息进行去除,也可以滤除一些信息不完整的问答对,以此能够减小数据处理量,简化处理步骤;再对经过预处理的问答对进行匹配分析,可以得到满足匹配条件的第二问答对,并将第二问答对作为建立问答知识库的重要元素。以此可以解决由于人为因素过多带来的知识遗漏、效率低的问题,并能够提高问答知识库的质量,从而向用户提供高质量的智能问答服务。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的服务器与客户端进行交互的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都小多科技有限公司,未经成都小多科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811180272.9/2.html,转载请声明来源钻瓜专利网。