[发明专利]机器智能问答方法、装置与电子设备有效
申请号: | 201910358742.4 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110110062B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 王文彬;李世杰;李东升;崔鸣;尚尔昕 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王庆龙;苗晓静 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 智能 问答 方法 装置 电子设备 | ||
本发明实施例提供一种机器智能问答方法、装置与电子设备,其中所述方法包括:若检测到接收的消息为疑问句,则采用带权重的文本识别模型,基于所述接收的消息,分别进行意图识别和字段识别,以筛选目标领域的疑问句,并识别所述目标领域的疑问句的具体问题;基于所述具体问题,通过查询所述目标领域的智能问答知识库,获取对应所述具体问题的答案并输出;其中,所述带权重的文本识别模型用于为所述接收的消息中的不同分词赋予不同的权重系数。本发明实施例结合问句识别和带权重及注意力机制的文本识别模型,仅筛选目标领域的疑问句进行智能回答,从而在基于目标领域的知识库进行智能回答时,能够有效提高智能问答的有效性、准确性和效率。
技术领域
本发明实施例涉及人工智能技术领域,更具体地,涉及一种机器智能问答方法、装置与电子设备。
背景技术
随着NLP技术的快速发展,各种聊天机器人不断出现,它们在闲聊以及任务型对话中取得了良好的效果。目前的机器问答系统,普遍采用基于知识库的问答模式。在基于知识库进行答案检索时,一个重要的前提是要对用户输入的问题进行准确识别,如此才能确定用户最真实的意图,输出与用户问题匹配度更高的答案。
现有技术在对用户问题进行识别时,多先对用户问题语段进行分词处理,再通过分别识别各分词,来识别用户问题。但是在采用这种识别方式进行问题识别的过程中,有时会存在如下问题:对于表达意思一样的语段,会由于几个字甚至是标点符号的不同,而导致识别结果存在较大的偏差,这将严重影响输出答案的有效性和准确性。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种机器智能问答方法、装置与电子设备,用以有效提高智能问答的有效性和准确性。
第一方面,本发明实施例提供一种机器智能问答方法,包括:
若检测到接收的消息为疑问句,则采用带权重的文本识别模型,基于所述接收的消息,分别进行意图识别和字段识别,以筛选目标领域的疑问句,并识别所述目标领域的疑问句所包含的具体问题;
基于所述具体问题,通过查询所述目标领域的智能问答知识库,获取对应所述具体问题的答案并输出;
其中,所述带权重的文本识别模型用于为所述接收的消息中的不同分词赋予不同的权重系数。
其中,所述带权重的文本识别模型具体为带权重的fasttext模型,表达如下:
式中,h表示隐变量,xi表示词向量,wi表示词向量xi的权重系数,w1,…,wn的加权和为1,hi表示隐变量h的第i维分量,xl,i表示词向量xi的第l维分量,wl表示xl,i的权重系数,n表示词向量的个数或词向量xi的维度。
进一步的,在所述分别进行意图识别和字段识别的步骤之前,本发明实施例的机器智能问答方法还包括:通过在所述带权重的fasttext模型中引入自注意力机制,关联所述接收的消息中在前的词语信息和在后的词语信息,形成关联信息;
相应的,基于所述接收的消息和所述关联信息,分别进行所述意图识别和所述字段识别。
进一步的,在所述采用带权重的fasttext模型,基于所述接收的消息,分别进行意图识别和字段识别的步骤之前,本发明实施例的机器智能问答方法还包括:
基于训练语料获取训练词向量,并基于所述训练词向量,采用误差反向传播与梯度下降法,训练初始化完成的基础带权重的fasttext模型,以迭代更新所述基础带权重的fasttext模型的权重系数,获取所述带权重的fasttext模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910358742.4/2.html,转载请声明来源钻瓜专利网。