[发明专利]一种智能问答的优化方法及装置、存储介质、终端在审

申请号：	202210248099.1	申请日：	2022-03-14
公开（公告）号：	CN114610853A	公开（公告）日：	2022-06-10
发明（设计）人：	谯轶轩	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F40/35;G06K9/62
代理公司：	北京中强智尚知识产权代理有限公司 11448	代理人：	黄耀威
地址：	518000 广东省深圳市福田街***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种智能问答优化方法装置存储介质终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种智能问答的优化方法及装置、存储介质、终端，涉及自然语言处理技术领域，主要目的在于解决现有问答模型输出答案是否准确与初步提取的文章紧密相关，且模型部署困难，从而导致现有问答系统性能较差的问题。包括：接收待回答问题并计算与所述待回答问题对应的问题向量；获取预设短语库中的多个短语向量；基于所述问题向量和所述短语向量，利用预先训练的问答模型计算短语与待回答问题之间的匹配概率；根据所述匹配概率输出所述待回答问题的答案。主要用于智能问答系统。

技术领域

本申请涉及自然语言处理技术领域，特别是涉及一种智能问答的优化方法及装置、存储介质、终端。

背景技术

随着大数据时代的到来和人工智能技术的飞速发展，人工智能设备已经遍布在各行各业，这些设备能够通过训练的模型实现语音识别、图像处理、翻译、文本分类等多种功能，智能问答就是其中之一。智能问答系统能够根据海量的语料信息，通过自然语言处理技术进行整理划分得到有序的知识结构，并针对问题进行快速的检索，获取问题的答案，能够满足各个领域的信息获取需求。

对于智能问答的实现方法，通常是通过收集大量的训练样本数据训练问答模型，问答模型识别输入的问题智能地输出问题的答案，具体地，问答模型主要是先针对给定的问题，从海量知识库中检索出于问题相关的文章，再从所有文章中提取出最符合给定问题的答案。也就是说，现有的问答系统输出的答案是否准确很大程度上取决于初步提取到的文章是否准确，且问答模型的基本处理单元为文章，但由于问答系统处理速度与输入长度的平方成正比关系，从而使得现有问答模型部署困难且处理时间较长，从而导致现有问答系统性能较差的问题。

发明内容

有鉴于此，本发明提供一种智能问答的优化方法及装置、存储介质、终端，主要目的在于解决现有问答模型输出答案是否准确与初步提取的文章紧密相关，且模型部署困难，从而导致现有问答系统性能较差的问题。

依据本发明一个方面，提供了一种智能问答的优化方法，包括：

接收待回答问题并计算与所述待回答问题对应的问题向量，所述问题向量为包含所述待回答问题的语义信息的向量；

获取预设短语库中的多个短语向量，各个所述短语向量为包含短语对应的上下文语义信息的向量；

基于所述问题向量和所述短语向量，利用预先训练的问答模型计算短语与待回答问题之间的匹配概率，所述匹配概率用于标识所述短语作为所述待回答问题的答案的匹配程度；

根据所述匹配概率输出所述待回答问题的答案。

进一步地，所述获取预设短语库中的多个短语向量之前，所述方法还包括：

获取文本库中的多个文章并按照短语粒度将各个所述文章进行划分，得到多个短语，每个短语在所属文章中对应有起始位置和结束位置；

将各个所述文章按照字符粒度输入第一BERT模型进行计算，得到多个字符向量；

根据所述起始位置对应的起始字符向量和所述结束位置对应的结束字符向量进行拼接，得到所述短语的短语向量；

基于所述多个文章包含的短语对应的短语向量生成所述预设短语库。