[发明专利]自动问答系统中的问题聚类处理方法及装置有效
申请号: | 201611002092.2 | 申请日: | 2016-11-14 |
公开(公告)号: | CN107656948B | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 王健宗;袁威强;韩茂琨;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 问答 系统 中的 问题 处理 方法 装置 | ||
本发明公开了一种自动问答系统中的问题聚类处理方法及装置。该方法包括:接收编写人员输入的聚类请求;基于聚类请求从未回复问题数据库中获取待聚类问题集;采用文本特征提取算法对待聚类问题集进行特征提取,输出问题特征集;判断问题特征集是否符合预设分裂条件;若符合预设分裂条件,则采用分割聚类算法对问题特征集进行分割聚类,输出至少两个问题特征子集;将问题特征子集更新为问题特征集,并判断问题特征集是否符合预设分裂条件;若不符合预设分裂条件,则将问题特征集作为聚类类簇输出。该自动问答系统中的问题聚类处理方法及装置中,可对待聚类问题集自动聚类,帮助编写人员了解问题咨询需求,提高编写的问答对的覆盖面。
技术领域
本发明涉及文本信息处理领域,尤其涉及一种自动问答系统中的问题聚类处理方法及装置。
背景技术
自动问答系统(Question and Answering,简称QA)综合运用知识表示、信息检索、自然语言处理等技术,能够接收用户以自然语言形式输入问题,即可返回简洁而准确的答案的系统。自动问答系统相比于传统的搜索引擎,具有更方便、更准确的优点,是当前自然语言处理及人工智能领域的研究热点。
在自动问答系统中通常需预先设置常问问题库(Frequently-Asked Question,简称FAQ),常问问题库用于存储至少一个问答对;每一问答对包括用户经常提问的问题和答案。在用户输入问题时,自动问答系统判断常问问题库中是否存在相同的问题;若存在相同的问题,则直接将常问问题库中对应的答案返回给用户,以利于提高自动问答系统的处理效率和准确率;若不存在相同的问题,则无法直接返回对应的答案,需人工回复或进行其他处理,使得自动问答系统的处理效率和准确率降低。由于自动问答系统回复问题的准确性和及时性,使其在客服或其他人工智能领域有较大的应用。由于自动问答系统能够及时准确地回复答案的前提是常问问题库中存在相应的问答对,因此常问问题库中的问答对越丰富、覆盖面越广,则自动问答系统中答案回答的准确率越高、效率越好。综上,问答对的编写是自动问答系统的核心。
现有自动问答系统中,问答对通常由编写人员编写问题,再由答复人员对问题进行解答,以形成问题与答案相对应的问答对。编写人员编写问题时通常基于自身经验、知识和记忆等因素进行考虑,存在局限性,使得编写人员编写的问题的覆盖面有限,不能完整且快速地覆盖到用户关注的问题,使得常问问题库中存储的问答对不能很好满足用户需求,而且编写人员编写问题的过程需耗费大量人力成本和时间成本,效率低。
发明内容
本发明要解决的技术问题在于,针对现有自动问答系统中,由编写人员编写问题所存在的问题覆盖面有限的不足,提供一种自动问答系统中的问题聚类处理方法及装置,通过对用户关注的问题进行聚类处理,提高问题设计的覆盖面,实现问答对的智能化设计。
本发明解决其技术问题所采用的技术方案是:一种自动问答系统中的问题聚类处理方法,包括:
接收编写人员输入的聚类请求;
基于所述聚类请求从未回复问题数据库中获取待聚类问题集,所述待聚类问题集包括至少一个待聚类问题;
采用文本特征提取算法对所述待聚类问题集进行特征提取,输出问题特征集,所述问题特征集包括至少一个问题特征;
判断所述问题特征集是否符合预设分裂条件;
若符合预设分裂条件,则采用分割聚类算法对所述问题特征集进行分割聚类,输出至少两个问题特征子集;将所述问题特征子集更新为问题特征集,并判断所述问题特征集是否符合预设分裂条件;
若不符合预设分裂条件,则将所述问题特征集作为聚类类簇输出。
优选地,所述判断所述问题特征集是否符合预设分裂条件,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611002092.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大型板材加工模具
- 下一篇:一种分布式数据库的联合访问方法