[发明专利]问题语句的改写方法、装置、计算机设备和存储介质有效

专利信息
申请号: 202011149730.X 申请日: 2020-10-23
公开(公告)号: CN112287080B 公开(公告)日: 2023-10-03
发明(设计)人: 刘东煜;陈乐清;曾增烽 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/247;G06F40/30
代理公司: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉;宋庆洪
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 问题 语句 改写 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及人工智能技术领域,可应用于智慧医疗领域中,以推动智慧城市的发展,提供一种问题语句的改写方法、装置、计算机设备和存储介质,获取用户输入的问题语句;基于同义词匹配,识别问题语句中每个可被替换的词,以及替换每个词的候选同义词;将每个词的候选同义词作为节点,将问题语句的起点作为起始节点,问题语句的终点作为结束节点;将候选同义词之间的句子片段作为连接节点之间的边,构建有向图;基于N‑gram语言模型,计算有向图中各个边的边权重;通过N最短路径算法计算出最短路径,将最短路径中各个节点对应的候选同义词改写至问题语句中,得到改写的问题语句。本申请通过最短路径的计算,找出最符合语境同义词,从而对语句进行改写。

技术领域

本申请涉及人工智能技术领域,特别涉及一种问题语句的改写方法、装置、计算机设备和存储介质。

背景技术

在医疗领域的FAQ(问题解答)模块中,用户可以提出与医疗相关的医疗问题,针对用户提出的医疗问题,其回复答案生成主要将用户的问题与问题模板匹配的方式完成。但是在某些情况下用户问题与模板问题语义相近,却无法召回答案。比如:用户问“抑郁症可以投保吗?”,而模板问为“精神病可以投保吗?”,这种情况下可以通过同义词改写的方式扩充输入的问题语句,如:“抑郁症”的同义词为“精神病”,则可以在一定程度上提高召回率。

在具体的应用场景,比如在数字医疗的FAQ问答机器人中,数据库会事先存储多个医疗问题的模板,当用户提问时会匹配到相应的模板问题从而进行自动回复。

然而,对于同一类问题,用户的提问方式却多种多样,同时也包含大量的口语表述,如:“注射疫苗-打疫苗”、“腿骨折-腿瘸了”、“取消-退保”等。

因此,在实际中虽然用户问题与模板问题的语义相近,却无法正确匹配到相应的回复。

因此,可以对用户的问题语句中的词进行同义词替换,但是在不同语境下同义词的合理性却存在差异。如“打疫苗”可以改写为“注射疫苗”,此时,“打”与“注射”是一组同义词,然而将“打篮球”改写为“注射篮球”却十分不合理。这样的例子普遍存在,如“可以投保吗?”可以改写为“能投保吗?”,而将“这个想法可以”改写为“这个想法能”却很滑稽。因此,目前的同义词替换存在不符合语境的缺陷。

发明内容

本申请的主要目的为提供一种问题语句的改写方法、装置、计算机设备和存储介质,旨在克服目前同义词改写时出现不符合语境的缺陷。

为实现上述目的,本申请提供了一种问题语句的改写方法,包括以下步骤:

获取用户输入的问题语句;

基于同义词匹配,识别所述问题语句中每个可被替换的词,以及替换每个所述词的候选同义词;

将每个所述词的候选同义词作为节点,将所述问题语句的起点作为起始节点,所述问题语句的终点作为结束节点;

将所述候选同义词之间的句子片段作为连接节点之间的边,分别在所述起始节点、结束节点与所述节点之间构建边;基于所述起始节点、结束节点、各个所述节点以及所述边,构建有向图;其中,所述有向图中的各个节点对应的候选同义词之间不存在交叉,所述有向图中由起始节点开始,由结束节点结束,且连接所述节点之间的边的方向为所述问题语句中排列在前的候选同义词对应的节点指向所述问题语句中排列在后的候选同义词对应的节点;

基于N-gram语言模型,计算所述有向图中各个边的边权重;

基于所述有向图以及所述有向图中各个边的边权重,通过N最短路径算法计算出最短路径,将所述最短路径中各个节点对应的候选同义词改写至所述问题语句中,得到改写后的问题语句。

进一步地,所述基于所述有向图以及所述有向图中各个边的边权重,通过N最短路径算法计算出最短路径,将所述最短路径中各个节点对应的候选同义词改写至所述问题语句中,得到改写后的问题语句的步骤之后,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011149730.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top