[发明专利]一种规避机器翻译译文片段重复的方法有效
| 申请号: | 202110743012.3 | 申请日: | 2021-07-01 |
| 公开(公告)号: | CN113191165B | 公开(公告)日: | 2021-09-24 |
| 发明(设计)人: | 张学强;张丹;董晓飞;万怡方;曹峰 | 申请(专利权)人: | 南京新一代人工智能研究院有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/44;G06F40/242 |
| 代理公司: | 南京知识律师事务所 32207 | 代理人: | 张苏沛 |
| 地址: | 210046 江苏省南京市栖霞*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开一种规避机器翻译译文片段重复的方法,属于自然语言处理中的机器翻译领域,在机器翻译的贪婪算法解码过程中,利用译文重复片段检测机制,对重复的生成的目标词语的生成概率进行惩罚,随着重复片段的长度增加,依次对目标词生成概率进行对数级、线性级、指数级惩罚,从而达到规避机器翻译生成重复片段的目的,本发明阶梯惩罚、逐步加重,保证既不过多影响原有译文解码过程,也能有效降低重复片段惩罚的漏警率;本发明充分考虑了原文中存在重复片段的情况,允许译文的重复片段长度小于或等于原文重复片段的长度,因此最大程度上保证了原文和译文的一致性,即降低了本提案方法的虚警率。 | ||
| 搜索关键词: | 一种 规避 机器翻译 译文 片段 重复 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京新一代人工智能研究院有限公司,未经南京新一代人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110743012.3/,转载请声明来源钻瓜专利网。





