[发明专利]一种基于跨语言监督的上下位关系检测方法有效
申请号: | 202110309925.4 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113032565B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 谢志鹏;谢水 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/284;G06F40/58;G06F40/49;G06N3/04;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语言 监督 下位 关系 检测 方法 | ||
1.一种基于跨语言监督的上下位关系检测方法,其特征在于,具体步骤为:
(1)向量预训练;
(2)词对预处理;
(3)统一语义空间映射;
(4)使用堆叠式双线性映射法表示词对;
(5)使用神经网络提取词对特征训练分类器;
(6)输出词对的上下位关系检测结果;
步骤(3) 中所述统一语义空间映射,包括使用两个不同的正交矩阵分别将源语言和目标语言词向量空间作线性变换映射成统一的向量空间,并将源语言和目标语言的词对都表示成统一空间内的相同维度向量;
步骤(4)中所述使用堆叠式双线性映射法表示词对,具体子过程包括:
(4.1)随机初始化多个行和列大小为统一空间维度的矩阵;
(4.2)每一个源语言和目标语言上的词对中两个词语的向量分别与上述矩阵做双线性映射,每个矩阵对应一个实数结果,然后把这些矩阵对应的实数结果合并拼接成中间关系向量;
(4.3)将步骤(4.2)生成的中间关系向量与词对中两个词语的在统一空间中的表示向量拼接得到词对表示向量;
步骤(5)中所述使用神经网络提取词对特征训练分类器,具体子过程包括:
(5.1)使用一个神经网络对输入的词对表示向量进行特征提取,最后一层网络将向量映射成一维实数;
步骤(5.2)使用sigmoid函数将一维实数的值转为在0到1之间的概率表示,然后对于源语言中的词对根据上下位关系类别:正样本:符合/负样本:不符合,使用交叉熵损失函数训练二元分类器;对于目标语言中的词对,假设一个源语言的上下位词对的翻译结果对中至少有一个目标语言词对也满足上下位关系,并且一个源语言的非上下位词对的翻译结果对基本都不满足上下位关系,于是,对于正样本的翻译结果,只有最高的分数被动态地选入模型代表那个至少正确的中文词对,对于负样本的翻译结果,把它们全部当作负样本送入模型训练;最后使用交叉熵计算正负样本的损失之和。
2.根据权利要求1所述的基于跨语言监督的上下位关系检测方法,其特征在于,步骤(1)中所述向量预训练,包括对源语言和目标语言上的无监督语料进行依存句法解析和使用词向量工具训练基于依存上下文的预训练词向量。
3.根据权利要求1所述的基于跨语言监督的上下位关系检测方法,其特征在于,步骤(2)中所述词对预处理,具体子步骤包括:
(2.1)通过网络词典或者机器翻译等方法将源语言上的有标注的词对翻译成目标语言上的词对,并且,如果源语言的翻译结果存在多个时,保留所有翻译结果并使用笛卡尔积的形式生成候选词对袋;
(2.2)通过对步骤(1)中的预训练词向量过滤,保留拥有词向量的词对,剩余的所有词对都用预训练的词向量表示。
4.根据权利要求1所述的基于跨语言监督的上下位关系检测方法,其特征在于,步骤(6)中所述输出词对的上下位关系检测结果,包括去除源语言词对的输入结构,对于目标语言上输入的词对,通过步骤(2)到步骤(5.1)的过程得到一个概率结果,概率大于0.5则认为满足上下位关系,概率小于0.5则认为不满足上下位关系;分类的效果采用平均准确率来评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110309925.4/1.html,转载请声明来源钻瓜专利网。