[发明专利]一种提高语义相似度训练方法及装置在审
申请号: | 201911369927.1 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111178084A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 詹威;肖龙源;蔡振华;李稀敏;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 高巍 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 语义 相似 训练 方法 装置 | ||
1.一种提高语义相似度训练方法,其特征在于,所述方法包括:
S1:从数据库中获取至少两个样本数据,基于孪生网络的语义相似度计算模型,提取两个样本数据的特征向量,计算两个特征向量的相似度,形成训练数据;
S2:通过对偶方式构造所述训练数据,得到对偶训练数据,基于孪生网络的语义相似度计算模型,对所述对偶训练数据进行相似度训练,形成增强性语义相似模型。
2.根据权利要求1所述的一种语义相似度训练方法,其特征在于,步骤S1进一步包括:
S11:所述两个样本数据分别作为所述基于孪生网络语义相似度计算模型的第一输入和第二输入,计算两个样本的相似度,并标注二者是否匹配的关联性标识;
步骤S2进一步包括:
S21:通过对偶方式构造所述两个样本数据分别作为所述基于孪生网络语义相似度计算模型的第二输入和第一输入,得到与步骤S11相同的相似度,并标注与步骤S11相同的关联性标识。
3.根据权利要求2所述的一种语义相似度训练方法,其特征在于,所述是否匹配的关联性包括:
所述两个样本数据之间为彼此关联,即二者匹配;
所述两个样本数据之间为彼此不关联,即二者不匹配。
4.根据权利要求1所述的一种语义相似度训练方法,其特征在于,所述数据库包括正样本数据和负样本数据;其中
所述正样本数据用于存储关联匹配的多个样本数据;
所述负样本数据用于存储不匹配的多个样本数据。
5.一种提高语义相似度训练装置,其特征在于,所述装置包括:
获取单元,用于从数据库中获取至少两个样本数据,基于孪生网络的语义相似度计算模型,提取两个样本数据的特征向量,计算两个特征向量的相似度,形成训练数据;
对偶构造单元,用于通过对偶方式构造所述训练数据,得到对偶训练数据,基于孪生网络的语义相似度计算模型,对所述对偶训练数据进行相似度训练,形成增强性语义相似模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911369927.1/1.html,转载请声明来源钻瓜专利网。