[发明专利]语义匹配方法、装置、设备及存储介质在审
申请号: | 201811386585.X | 申请日: | 2018-11-20 |
公开(公告)号: | CN111274822A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 晏小辉 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/332 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 匹配 方法 装置 设备 存储 介质 | ||
1.一种语义匹配方法,其特征在于,所述方法包括:
获取第一文本的第一抽象语义表示AMR图以及第二文本的第二AMR图,每个AMR图中的每个节点为向量;
基于所述第一AMR图的至少一个第一节点的向量对应的潜在语义分析LSA信息以及所述第二AMR图的至少一个第二节点的向量对应的LSA信息,对所述第一AMR图与所述第二AMR图进行匹配,得到所述第一AMR图与所述第二AMR图之间的图匹配度;
将所述图匹配度,作为所述第一文本与所述第二文本之间的语义匹配度。
2.根据权利要求1所述的方法,其特征在于,AMR图的获取过程,包括:
对文本进行解析,得到初始AMR图,所述初始AMR图中的每个节点为概念标签;
将所述初始AMR图输入LSA模型,输出AMR图,所述LSA模型用于根据节点的概念标签,预测节点的向量。
3.根据权利要求2所述的方法,其特征在于,所述LSA模型的训练过程,包括:
基于多个样本句子,获取每个样本句子中每个概念的重要度;
基于所述每个样本句子中每个概念的重要度,构建句子概念矩阵,所述句子概念矩阵的每一行对应一个样本句子,每一列对应一个概念,任一行任一列的元素为所述列对应的概念在所述行对应的样本句子中的重要度;
对所述句子概念矩阵进行奇异值分解,得到每个概念对应的向量。
4.根据权利要求3所述的方法,其特征在于,所述基于多个样本句子,获取每个样本句子中每个概念的重要度,包括:
对所述多个样本句子的AMR图进行合并,得到第三AMR图;
采用网页排名算法,对所述AMR图进行运算,得到所述第三AMR图的每个第三节点的网页排名PR值;
对于任一个样本句子中的任一个概念,基于所述概念对应的第三节点的PR值以及所述样本句子中所述概念的出现次数,获取所述样本句子中所述概念的重要度,所述重要度与所述PR值和所述出现次数正相关。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一AMR图的至少一个第一节点的向量对应的潜在语义分析LSA信息以及所述第二AMR图的至少一个第二节点的向量对应的LSA信息之前,所述方法还包括:
对于所述至少一个第一节点以及所述至少一个第二节点中的每个节点,将所述节点的向量作为所述节点的LSA信息。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一AMR图的至少一个第一节点的向量对应的LSA信息以及所述第二AMR图的至少一个第二节点的向量对应的LSA信息,对所述第一AMR图与所述第二AMR图进行匹配,得到所述第一AMR图与所述第二AMR图之间的图匹配度,包括:
对于任一第一节点以及任一第二节点,基于所述第一节点的向量对应的LSA信息以及所述第二节点的向量对应的LSA信息,获取所述第一节点与所述第二节点之间的节点匹配度;和/或,对于任一第一边与任一第二边,基于所述第一边连接的两个第一节点的向量对应的LSA信息以及所述第二边连接的两个第二节点的向量对应的LSA信息,获取所述第一边与所述第二边之间的边匹配度;
基于所述至少一个节点匹配度以及所述至少一个边匹配度,获取所述图匹配度。
7.根据权利要求6所述的方法,其特征在于,所述基于所述第一边连接的两个第一节点的向量对应的LSA信息以及所述第二边连接的两个第二节点的向量对应的LSA信息,获取所述第一边与所述第二边之间的边匹配度,包括:
基于所述第一边的第一起点的LSA信息、所述第二边的第二起点的LSA信息,获取所述第一起点与所述第二起点的节点匹配度,得到第一节点匹配度,所述第一起点属于所述第一边连接的两个第一节点,所述第二起点属于所述第二边连接的两个第二节点;
基于所述第一边的第一终点的LSA信息、所述第二边的第二终点的LSA信息,获取所述第一终点与所述第二终点的节点匹配度,得到第二节点匹配度,所述第一终点属于所述第一边连接的两个第一节点,所述第二终点属于所述第二边连接的两个第二节点;
基于所述第一节点匹配度以及所述第二节点匹配度,获取所述边匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811386585.X/1.html,转载请声明来源钻瓜专利网。