[发明专利]用于城市大脑的多模型融合问答方法及系统、介质有效
申请号: | 202010628531.0 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111782786B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 张宏志;李浩浩;马亚中;何彬;梅一多;张聪聪 | 申请(专利权)人: | 中关村科学城城市大脑股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/35 |
代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 |
地址: | 100081 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 城市 大脑 模型 融合 问答 方法 系统 介质 | ||
本发明公开了一种用于城市大脑的多模型融合问答方法,包括:依据知识图谱库获取用户输入问句的第一答案,确定第一置信度;依据问答库对用户输入问题进行匹配,确定第二答案及第二置信度;依据生成式预训练获取用户输入问句的预测答案;依据问答库对预测答案进行匹配确定第三答案及第三置信度;对第一置信度、第二置信度、第三置信度进行融合分类,获取目标答案。本发明还公开了一种用于城市大脑的多模型融合问答系统、计算机存储介质。该用于城市大脑的多模型融合问答方法目的是解决问答方法因选择具有很大经验性的人工设置阈值而导致的非最优化的的问题。
技术领域
本发明属于人工智能技术领域,具体涉及一种用于城市大脑的多模型融合问答方法及系统、介质。
背景技术
目前专业领域问答系统算法大都是将用户问题直接与问答库中的问题进行匹配。问题-问题之间的匹配采用问题间的相似度排名计算。此类模型对问答库中的答案没有进行有效利用,导致答案中的有效信息未进行考虑,同时由于生成式回答的不易把控,导致专业领域问答系统都未采用该模型,尽管有的问答系统用到了生成模型,但也仅仅限于闲聊领域。
目前深度语义匹配度在问答系统中有较多应用,但是深度语义一般需要将问答库中的问题矢量预先全部加载到内存中,在搜索时进行匹配,既消耗资源也不利于热更新。
一般的问答系统都采用两个以上模型,但在最后对模型的选取上大多选择人工设置阈值,多个模型的选取上大多选择人工设置阈值,具有很大的经验性,准确率也存在一定不确定性。
有鉴于此,本领域技术人员亟待提供一种用于城市大脑的多模型融合问答方法及系统、存储介质用于解决问答系统单一和因选择具有很大经验性的人工设置阈值而导致的非最优化的问题。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是问答系统单一和因选择具有很大经验性的人工设置阈值而导致的非最优化。
(二)技术方案
本发明的第一方面提供了一种用于城市大脑的多模型融合问答方法,包括以下步骤:
依据知识图谱库获取用户输入问句的第一答案,确定第一置信度;
依据问答库对所述用户输入问句进行向量匹配,确定第二答案及第二置信度;
依据生成式预训练获取所述用户输入问句的预测答案;
依据问答库对预测答案进行匹配确定第三答案及第三置信度;
根据排序模型对所述第一置信度、所述第二置信度、所述第三置信度进行融合分类,获取目标答案。
可选的,所述依据问答库对所述用户输入问句进行向量匹配,确定第二答案及第二置信度,具体包括如下步骤:
将所述问答库中的问题通过向量表征离线存储于搜索引擎;
通过所述搜索引擎检索所述用户输入问句,匹配出所述第二答案,确定所述第二答案的第二置信度。
可选的,所述将所述问答库中的问题通过向量表征离线存储于搜索引擎,具体包括如下步骤:
通过Bert预训练获取微调后的问答库;
存储所述微调后的问答库中的问题至所述搜索引擎。
可选的,所述依据生成式预训练获取所述用户输入问句的预测答案,具体包括如下步骤:
对每条训练数据进行顺序拼接,并将拼接后的训练数据输入到网络中进行训练;
依据GPT-2神经网络训练,获取所述预测答案。
可选的,根据排序模型对第一置信度、第二置信度、第三置信度进行融合分类,获取目标答案,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中关村科学城城市大脑股份有限公司,未经中关村科学城城市大脑股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010628531.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光网络通信路径自动搜索规划的方法
- 下一篇:一种塔吊的齿轮引进结构