[发明专利]自然语言处理方法、装置、电子设备和存储介质在审
申请号: | 202110216915.6 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112925889A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 陈孝良;李良斌;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F40/211;G06F40/30;G06K9/62;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王英 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 处理 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种自然语言处理方法、装置、电子设备和存储介质。用于解决相关技术中FAQ和KBQA的应用场景中信息冗余导致的资源浪费的问题。本申请实施例中,首先基于查询语句进行搜索粗筛获取多条候选语句,然后确定上述各条语句的长度,并根据该语句的长度确定输入给语义识别模型的信息长度;获取语义识别模型输出的各条语句的语义信息,并根据各条语句的语义信息动态地确定查询语句与候选语句的语义相似度,最后基于相似度对用户的问题进行应答处理。
技术领域
本申请涉及智能问答系统技术领域,尤其涉及一种自然语言处理方法、装置、电子设备和存储介质。
背景技术
在智能问答系统中,通常采用语音识别、自然语言处理(Natural LanguageProcessing,NLP)等技术,以对话的方式自动理解用户的语音或文字,在无需人工干预的情况下,分析用户输入的语音或文字并向用户返回合适的答案。作为人工智能的重要落地场景,智能问答系统广泛应用于智能音箱、智能客服等领域,可以极大的降低人工成本,并带来更加友好、丰富的用户体验。
相关技术中,为了实现智能问答,通常将基于知识库问答(Question Answeringover Knowledge Base,KBQA)与常见问题解答(Frequently Asked Questions,FAQ)的技术方案进行结合,前者覆盖结构性比较强的场景,后者则覆盖更加通用的场景。
相关技术中,采用神经网络来计算不同句子之间的相似度。例如,计算用户语句和多个已知语句的相似度,然后挑选与用户语句的相似度最高的已知语句对应的“答案”来回答用户语句。为了计算不同句子之间的相似度,需要补充大量的pad字符到用户语句和已知语句中才能进入神经网络来确定不同语句的相似度,故此无论是训练还是预测过程,都带来了一些计算资源的浪费。
发明内容
本申请的目的是提供一种自然语言处理方法、装置、电子设备和存储介质,用于解决相关技术中FAQ和KBQA的应用场景中信息冗余导致的资源浪费的问题。
第一方面,本申请实施例提供了一种自然语言处理方法,包括:
获取查询语句的多条候选语句;
确定所述查询语句和所述多条候选语句中各条语句的长度;
根据所述各条语句的长度,确定输入给语义识别模型的信息长度;
基于确定的所述信息长度对所述各条语句分别进行处理后,输入给所述语义识别模型得到所述查询语句和所述多条候选语句各自的语义信息;
基于所述语义信息确定各所述候选语句与所述查询语句的语义相似度。
在一个实施例中,所述根据所述各条语句的长度,确定输入给语义识别模型的信息长度,包括:
确定所述各条语句的最大长度;
将所述最大长度与预设长度进行比较;
若所述最大长度大于或等于所述预设长度,则所述信息长度为所述预设长度;
若所述最大长度小于所述预设长度,则所述信息长度为所述最大长度。
在一个实施例中,所述基于确定的所述信息长度对所述各条语句分别进行处理,包括:
对语句长度大于所述信息长度的语句,从所述语句中截取所述信息长度的语句内容;
对语句长度小于所述信息长度的语句,对所述语句进行填充处理得到所述信息长度的语句。
在一个实施例中,所述语句中依序包括起始位、语句、结束位,所述以在句末补填充位的方式对所述语句进行填充处理,包括:
在语句的结束位后以补填充位的方式对所述语句进行填充处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110216915.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纸张印刷覆膜设备及其生产工艺
- 下一篇:目标群体分类方法及装置