[发明专利]自动翻译方法、设备和系统在审
申请号: | 201710256367.3 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107590135A | 公开(公告)日: | 2018-01-16 |
发明(设计)人: | 李昊潼;朴永起;柳尚贤 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京铭硕知识产权代理有限公司11286 | 代理人: | 张川绪,王兆赓 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 翻译 方法 设备 系统 | ||
本申请要求于2016年7月7日提交到韩国知识产权局的第10-2016-0086036号韩国专利申请的权益,所述韩国专利申请的全部公开为了所有的目的通过引用合并于此。
技术领域
下面的描述涉及一种自动翻译方法和设备。
背景技术
互联网和信息电信(IT)技术的发展已经使人们能够接收各种语言的内容。此外,随着商业的全球化,用于在使用各种语言的用户之间的内容翻译和通信的识别和翻译技术已经引起兴趣。
由于使用的词语或句子的表达方式的不同,可从具有相似或相同含义的语音输入派生出不同的识别和翻译。
发明内容
提供本发明内容来以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不旨在标识要求保护的主题的关键特征和必要特征,本发明内容也不旨在作为帮助确定要求保护的主题的范围而被使用。
在一个总体方面,一种自动翻译方法包括:对第一语言的语音信号进行编码以生成第一特征向量;对第一特征向量进行解码以生成第一语言的第一语言句子;对第一语言句子进行编码以生成针对第二语言的第二特征向量;对第二特征向量进行解码以生成第二语言的第二语言句子;基于第一特征向量、第一语言句子、第二特征向量和第二语言句子中的任意一个或任意组合,控制生成候选句子列表;从候选句子列表,选择最终第二语言句子作为语音信号的翻译。
生成候选句子列表的步骤可包括:从数据库获取被确定为对应于来自数据库的第一特征向量、第一语言句子、第二特征向量和第二语言句子中的任意一个或任意组合的候选句子。
获取候选句子的步骤可包括:基于一个或多个近似最近邻(NN)算法,从存储在数据库中的多个元素检索被确定为与第一特征向量、第一语言句子、第二特征向量和第二语言句子中的任意一个相似的各个元素。
生成候选句子列表的步骤可包括以下步骤的任意一个或任意组合:从数据库获取与被确定为相似于第一特征向量的第一语言特征向量匹配的第一翻译结果;从数据库获取与被确定为相似于第一语言句子的先前识别的句子匹配的第二翻译结果;从数据库获取与被确定为相似于第二特征向量的第二语言特征向量匹配的第三翻译结果;从数据库获取与被确定为相似于第二语言句子的先前翻译句子匹配的第四翻译结果。
生成候选句子列表的步骤还可包括:将与第一翻译结果、第二翻译结果、第三翻译结果和第四翻译结果中的任意翻译结果对应的任意先前翻译句子添加到候选句子列表,并且将第二语言句子添加到候选句子列表。
获取第二翻译结果的步骤可包括:将第一语言句子转换成向量,并且基于所述向量从数据库确定多个先前识别的句子中的哪些与第一语言句子相似。
获取第四翻译结果的步骤可包括:将第二语言句子转换成向量,并且基于所述向量从数据库确定多个先前翻译句子中的哪些与第二语言句子相似。
选择最终第二语言句子的步骤可包括:基于第二特征向量,计算在候选句子列表中包括的候选句子的分数,并且从候选句子列表选择具有最高的计算的分数的候选句子作为最终第二语言句子。
生成第一特征向量的步骤可包括:基于预定的帧长度,对第一语言的语音信号进行采样;生成与帧对应的各个输入向量;将各个输入向量顺序地输入到用于语音识别的编码器;将第一特征向量确定为针对顺序地输入的各个输入向量从所述编码器的输出。
生成第一语言句子的步骤可包括:将第一特征向量输入到用于语音识别的解码器;基于从所述解码器顺序地输出的子词的概率,生成预定数量的句子序列;在所述预定数量的句子序列中,选择具有最高分数的句子序列作为第一语言句子。
生成第二特征向量的步骤可包括:将第一语言句子划分为多个子词;将分别指示所述多个子词的输入向量顺序地输入到用于机器翻译的编码器;将第二特征向量确定为针对顺序地输入的输入向量从所述编码器的输出。
生成第二语言句子的步骤可包括:将第二特征向量输入到用于机器翻译的解码器;基于从所述解码器顺序地输出的子词的概率,生成预定数量的句子序列;在所述预定数量的句子序列中,选择具有最高分数的句子序列作为第二语言句子。
所述方法还可包括:将第一特征向量、第一语言句子和第二特征向量存储在数据库中;将与第一特征向量、第一语言句子和第二特征向量对应的第二语言句子和最终第二语言句子中的任意一个或任意组合存储在数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710256367.3/2.html,转载请声明来源钻瓜专利网。