[发明专利]译文术语词形自适应替换方法、装置及电子设备在审
| 申请号: | 202310088953.7 | 申请日: | 2023-01-17 |
| 公开(公告)号: | CN116306695A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 毛红保 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/211;G06F18/214;G06N3/04;G06N3/08;G06F40/42 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 常芳 |
| 地址: | 430206 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 译文 术语 词形 自适应 替换 方法 装置 电子设备 | ||
1.一种译文术语词形自适应替换方法,其特征在于,包括:
对待翻译文本的原始译文文本进行术语替换处理,得到合成译文文本;
将所述合成译文文本输入至第一译文术语替换模型中,获取所述第一译文术语替换模型输出的所述待翻译文本对应的目标译文文本;
所述第一译文术语替换模型是根据合成译文文本样本和对应的真实译文文本标签训练得到的,所述合成译文文本样本是通过对原始译文文本样本进行术语替换处理得到的。
2.根据权利要求1所述的译文术语词形自适应替换方法,其特征在于,所述对待翻译文本的原始译文文本进行术语替换处理,得到合成译文文本,包括:
对待翻译文本的原始译文文本进行分句处理,得到所述原始译文文本对应的多个句子;
采用术语提取工具在每个所述句子上进行术语提取,并对每个所述句子提取到的术语进行标记,确定每个所述句子中的术语的标记位置;
采用词形还原工具,根据每个所述句子中的术语的标记位置,将每个所述句子中的术语还原为对应的原始术语,得到所述合成译文文本。
3.根据权利要求1所述的译文术语词形自适应替换方法,其特征在于,在所述对待翻译文本的原始译文文本进行术语替换处理,得到合成译文文本之后,所述方法还包括:
将所述合成译文文本输入至第二译文术语替换模型中,获取所述第二译文术语替换模型输出的所述原始译文文本对应的目标术语;所述第二译文术语替换模型是根据所述合成译文文本样本和对应的术语标签训练得到的;
将所述合成译文文本中的原始术语替换为对应的所述目标术语,得到所述待翻译文本对应的所述目标译文文本。
4.根据权利要求1所述的译文术语词形自适应替换方法,其特征在于,在将所述合成译文文本输入至第一译文术语替换模型中之前,所述方法还包括:
将所述合成译文文本样本和所述合成译文文本样本对应的真实译文文本标签作为一组训练样本,获取多组训练样本;
利用所述多组训练样本对T5模型进行训练,得到所述第一译文术语替换模型。
5.根据权利要求4所述的译文术语词形自适应替换方法,其特征在于,利用所述多组训练样本对T5模型进行训练,得到所述第一译文术语替换模型,包括:
对于任意一组训练样本,将所述训练样本进行分词处理,得到分词处理后的训练样本;
将所述分词处理后的训练样本输入至所述T5模型,输出所述分词处理后的训练样本对应的预测概率;
利用预设损失函数,根据所述分词处理后的训练样本对应的预测概率和所述训练样本对应的真实译文文本标签,计算损失值;
基于所述损失值,对所述T5模型的模型参数进行调整,直至所述损失值小于预设阈值或迭代次数达到预设次数;
将所述损失值小于预设阈值或迭代次数达到预设次数时所得到的模型参数作为训练好的T5模型的模型参数,得到所述第一译文术语替换模型。
6.根据权利要求5所述的译文术语词形自适应替换方法,其特征在于,将所述分词处理后的训练样本输入至所述T5模型,输出所述分词处理后的训练样本对应的预测概率,包括:
通过所述T5模型的多层编码器,利用双向注意力掩码机制对所述分词处理后的训练样本进行逐词编码,得到所述分词处理后的训练样本对应的隐藏层状态向量;
通过所述T5模型的多层解码器,利用单向注意力掩码机制对所述隐藏层状态向量进行逐词解码,得到所述分词处理后的训练样本对应的预测概率。
7.一种译文术语词形自适应替换装置,其特征在于,包括:
合成模块,用于对待翻译文本的原始译文文本进行术语替换处理,得到合成译文文本;
将所述合成译文文本输入至第一译文术语替换模型中,获取所述第一译文术语替换模型输出的所述待翻译文本对应的目标译文文本;
所述第一译文术语替换模型是根据合成译文文本样本和对应的真实译文文本标签训练得到的,所述合成译文文本样本是通过对原始译文文本样本进行术语替换处理得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310088953.7/1.html,转载请声明来源钻瓜专利网。





