[发明专利]基于人工智能的翻译方法和装置有效
申请号: | 201611138600.X | 申请日: | 2016-12-12 |
公开(公告)号: | CN106649288B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 何中军;刘红雨;赵世奇;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 翻译 方法 装置 | ||
1.一种基于人工智能的翻译方法,其特征在于,包括以下步骤:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;源语言词语是等待推荐目标词语的词语;目标语言词语是用户确定翻译方式,无需进行推荐的词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐;
其中,所述根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐,包括:
针对每一个候选词语,将所述候选词语翻译得到的候选译文的语言概率和所述候选词语的置信度进行加权求和,得到所述候选词语的总概率;所述总概率,在待翻译文本中包括多段源语言词语时,针对每一个源语言词语输入翻译模型以确定候选词语及相应的置信度,并计算全部源语言词语的候选词语组合所得到的候选词语组合的总置信度,对所述总置信度和所述语言概率加权求和得到;
依据所述总概率对各候选词语进行排序,从各候选词语中选择目标词语进行推荐。
2.根据权利要求1所述的基于人工智能的翻译方法,其特征在于,所述目标词语的个数为至少两个;所述选择目标词语进行推荐,包括:
将所选择的至少两个目标词语,按照所述总概率由大到小的顺序依次显示在对应源语言词语的下方;其中,在每一个目标词语旁,以进度条形式指示所述目标词语的总概率。
3.根据权利要求1或2所述的基于人工智能的翻译方法,其特征在于,所述将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度之前,还包括:
利用所述目标语言和所述源语言的双语料库,对所述翻译模型进行训练,以确定具有语义对应关系的源语言词语和目标语言词语,以及所述目标语言词语准确翻译所述源语言词语的置信度。
4.根据权利要求3所述的基于人工智能的翻译方法,其特征在于,所述置信度是根据在所述双语料库中,采用所述目标语言词语翻译所述源语言词语的次数,占翻译所述源语言词语的总次数之比。
5.根据权利要求1或2所述的基于人工智能的翻译方法,其特征在于,所述将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率之前,还包括:
利用所述目标语言的语料库,对所述目标语言的语言模型进行训练;所述语料库是根据所述目标语言的学术会议、期刊和/或论文进行构建的。
6.根据权利要求5所述的基于人工智能的翻译方法,其特征在于,所述语言模型为n-gram语言模型或神经网络语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611138600.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:椅子(MK‑701)
- 下一篇:儿童高脚餐椅(61型)