[发明专利]文本查询方法、装置、电子设备及计算机可读存储介质有效
申请号: | 201910785334.7 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110795541B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 陈华栋;徐广庆 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F18/22 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 查询 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请涉及信息处理技术领域,公开了一种文本查询方法、装置、电子设备及计算机可读存储介质,文本查询方法包括:接收用户输入的初始查询语句,查询预设的语句库中与初始查询语句之间匹配度高于预设阈值的第一相似语句;语句库包括相似语句和相应的答案文本;相似语句基于样本查询语句通过翻译及反向翻译得到;若得到第一相似语句,则查询语句库中与第一相似语句相应的第一答案文本;若未得到第一相似语句,则将初始查询语句输入预设的训练后的复述模型,得到相应的第二相似语句,并依据第二相似语句得到相应的第二答案文本;训练后的复述模型基于样本查询语句和对应的相似语句训练得到,可以提高向用户推送的答案文本的准确率。
技术领域
本申请涉及信息处理技术领域,具体而言,本申请涉及一种文本查询方法、装置、电子设备及计算机可读存储介质。
背景技术
自动问答系统,又称为人机对话系统,用户以自然语言形式描述问题,自动问答系统解答用户提出的问题,通常自动问答系统中可以预先存储有多个问答对,每一个问答对包括一个查询问题和相应的答案文本。
由于自然语言的特点,同样一个意思的查询问题,可以有很多种问法,当用户提出的问题和问答系统存储的查询问题之间具有一些不同的字符时,不同的字符会干扰问答系统对查询问题所对应的查询意图的识别,使得系统识别查询意图的准确率下降,进而降低向用户推送答案文本的正确率。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:
第一方面,提供了一种文本查询方法,包括:
接收用户输入的初始查询语句,查询预设的语句库中与初始查询语句之间匹配度高于预设阈值的第一相似语句;其中,语句库包括相似语句和相应的答案文本;相似语句基于样本查询语句通过翻译及反向翻译得到;
若得到第一相似语句,则查询语句库中与第一相似语句相应的第一答案文本;
若未得到第一相似语句,则将初始查询语句输入预设的训练后的复述模型,得到相应的第二相似语句,并依据第二相似语句得到相应的第二答案文本;其中,训练后的复述模型基于样本查询语句和对应的相似语句训练得到。
在第一方面的可选实施例中,接收用户输入的初始查询语句的步骤之前,还包括:
获取样本查询语句,将样本查询语句进行翻译并反向翻译,基于得到的反向翻译语句获取与样本查询语句相应的相似语句;
获取与样本查询语句相应的答案文本,根据相似语句及答案文本之间的对应关系构建语句库。
在第一方面的可选实施例中,将样本查询语句进行翻译并反向翻译的步骤,包括:
将样本查询语句输入至少两种不同的翻译引擎中进行翻译,得到相应的翻译语句;
将翻译语句依据预定的输入方式输入至少两种不同的翻译引擎中进行反向翻译,得到与样本查询语句的语言种类相同的反向翻译语句。
在第一方面的可选实施例中,基于得到的反向翻译语句获取与样本查询语句相应的相似语句的步骤,包括:
从反向翻译语句中提取与样本查询语句相似度符合预设条件的语句设为相似语句。
在第一方面的可选实施例中,从反向翻译语句中提取与样本查询语句相似度符合预设条件的语句设为相似语句的步骤,包括:
获取各反向翻译语句与样本查询语句之间的相似度;
选取相似度大于预设相似度值的反向翻译语句设为相似语句。
在第一方面的可选实施例中,从反向翻译语句中提取与样本查询语句相似度符合预设条件的语句设为相似语句的步骤,包括:
获取各反向翻译语句与样本查询语句之间的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910785334.7/2.html,转载请声明来源钻瓜专利网。