[发明专利]语句相似度的分析方法、装置及计算机设备有效
| 申请号: | 201911382184.1 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111198939B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 李佳;吴玉武;张东阳;王子诚 | 申请(专利权)人: | 北京健康之家科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/295;G06F40/30;G06N3/08;G06K9/62 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 100102 北京市朝阳区利*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语句 相似 分析 方法 装置 计算机 设备 | ||
本发明公开了一种语句相似度的分析方法、装置及计算机设备,涉及计算机技术领域,可以解决在计算语句相似度时,分析结果误差较大,不够精确的问题。其中方法包括:将接收到的文本语句与知识库中存储的任意一个基础语句,确定为待分析相似度的目标语句;根据词语间的相关性,配置目标语句中各个词语对应的目标权重;基于所述目标权重,构建所述目标语句的目标句向量;分析两个目标语句分别对应的目标句向量之间的交互对比信息;基于所述交互对比信息,确定所述两个目标语句之间的语句相似度。本发明适用于对语句间相似度的分析。
技术领域
本发明涉及计算机技术领域,尤其涉及到一种语句相似度的分析方法、装置及计算机设备。
背景技术
语义相似度计算也可以称作文本匹配,语句间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在自然语言处理应用中,如保险服务、网络互助服务中的智能客服问答系统,语句间相似度的计算是一个非常关键的问题。
当前中文语义相似性计算方法可如附图1所示,主要是将两个语句分别分词后使用预训练好的词向量对词进行表达,然后将词向量输入序列神经网络模型,计算出语句的句向量,再将生成的两个句向量进行拼接,输入分类神经网络模型,输出两个语句的相似度。
然而现有计算语句相似度的方法仅仅根据词向量序列计算得到句向量,并对句向量表达信息进行非线性计算,未能考虑语句向量之间的交互对比信息,丢失了重要的语句对比特征,使分析结果误差较大,不够精确。
发明内容
本发明实施例所要解决的技术问题是现有计算语句相似度的方法未能考虑语句向量之间的交互对比信息,从而丢失了重要的语句对比特征,使分析结果误差较大,不够精确。
根据本发明的一个方面,提供了一种语句相似度的分析方法,该方法包括:
将接收到的文本语句与知识库中存储的任意一个基础语句,确定为待分析相似度的目标语句;
根据词语间的相关性,配置目标语句中各个词语对应的目标权重;
基于所述目标权重,构建所述目标语句的目标句向量;
分析两个目标语句分别对应的目标句向量之间的交互对比信息;
基于所述交互对比信息,确定所述两个目标语句之间的语句相似度。
可选地,所述根据词语间的相关性,配置目标语句中各个词语对应的目标权重,具体包括:
从目标语句中拆分出目标词语;
依据注意力模型确定所述目标词语各自对应的隐向量;
利用所述隐向量计算所述目标词语间的相关性;
根据所述相关性配置所述目标词语对应的目标权重。
可选地,所述基于所述目标权重,构建目标语句的目标句向量,具体包括:
计算所述目标词语的目标权重与对应隐向量乘积的累加和,将所述累加和确定为目标词向量;
依据所述目标词语各自所在所述目标语句中的位置信息,拼接所述目标词向量,获取得到所述目标语句的目标句向量。
可选地,所述分析两个目标语句分别对应的目标句向量之间的交互对比信息,具体包括:
获取第一目标语句构建的第一目标句向量,以及第二目标语句构建的第二目标句向量,所述第一目标句向量对应所述文本语句的句向量,所述第二目标句向量对应所述基础语句的句向量;
计算所述第一目标句向量和所述第二目标句向量间的曼哈顿距离,作为交互对比信息。
可选地,所述基于所述交互对比信息,确定所述两个目标语句之间的语句相似度,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京健康之家科技有限公司,未经北京健康之家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911382184.1/2.html,转载请声明来源钻瓜专利网。





