[发明专利]翻译方法、系统、设备及存储介质在审
| 申请号: | 202111088449.4 | 申请日: | 2021-09-16 |
| 公开(公告)号: | CN113810493A | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 宋雅奇;李思敏 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L9/00;G10L15/26;G06F40/58;G10L15/06 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 翻译 方法 系统 设备 存储 介质 | ||
本申请涉及机器翻译技术领域,公开了一种翻译方法,系统、电子设备及存储介质,所述方法应用于边缘计算节点,包括:从云计算服务器获取由所述云计算服务器构建和训练的深度学习模型,以及从终端获取待翻译数据;所述深度学习模型包括识别模型和翻译模型;通过所述识别模型,将所述待翻译数据转化为文本数据;通过所述翻译模型,将所述文本数据翻译为目标语言的文本数据。本申请由边缘计算节点进行用户终端设备处获取的待翻译数据的翻译,可以提高翻译的实时性,并节省终端设备至云计算中心服务器的传输开销。
技术领域
本申请涉及机器翻译技术领域,尤其涉及一种翻译方法、系统设备及存储介质。
背景技术
语言之间的转化翻译在用户终端上被广泛应用,相关的翻译模式是用户终端将待翻译数据发送到远端的云计算中心,云计算中心经处理和分析后将翻译结果回传用户终端。
云计算中心具有较强的计算和存储能力,但是用户终端与云计算中心之间的海量数据的传输需要很大的带宽,极易造成拥塞;对于量级较大的高清图像或长语音形式的待翻译数据,传输时延会影响用户体验。
发明内容
本申请的实施例提供了一种翻译方法、系统设备及存储介质,进而至少在一定程度上能够解决将待翻译数据传输至云计算中心进行翻译的大带宽、高延迟问题,提高翻译的实时性,减少传输开销。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的第一方面,提供了一种翻译方法,应用于边缘计算节点,所述方法包括:
从云计算服务器获取由所述云计算服务器构建和训练的深度学习模型,以及从终端获取待翻译数据;所述深度学习模型包括识别模型和翻译模型;
通过所述识别模型,将所述待翻译数据转化为文本数据;
通过所述翻译模型,将所述文本数据翻译为目标语言的文本数据。
在本申请的一些实施例中,基于前述方案,所述待翻译数据包括图像和语音,所述识别模型包括图像识别模型和语音识别模型;所述通过所述识别模型,将所述待翻译数据转化为文本数据,包括:
通过所述图像识别模型,识别所述图像中的文本,得到第一文本数据;
通过所述语音识别模型,将所述语音转化为第二文本数据。
在本申请的一些实施例中,基于前述方案,所述图像识别模型包括目标检测模型和文字识别模型;所述通过所述图像识别模型,识别所述图像中的文本,得到第一文本数据,包括:
通过所述目标检测模型检测所述图像中的文本区域,并裁剪出所述图像的文本区域,得到包含所述文本区域的局部图像;
通过所述文字识别模型识别所述局部图像中的文本,得到所述第一文本数据。
在本申请的一些实施例中,基于前述方案,所述文字识别模型包括积网络层、循环网络层以及转录层;通过所述文字识别模型识别所述局部图像中的文本,得到所述第一文本数据,包括:
通过所述文字识别模型的卷积网络层,提取所述局部图像对应的图像特征序列;
通过所述文字识别模型的循环网络层,获取所述图像特征序列对应的概率分布矩阵;
通过所述文字识别模型的转录层,将所述概率分布矩阵进行解码,得到所述第一文本数据。
在本申请的一些实施例中,基于前述方案,所述语音识别模型包括声学特征提取模型、声学模型以及语言模型;所述通过所述语音识别模型,将所述语音转化为第二文本数据,包括:
通过所述声学特征提取模型,对所述语音进行特征提取,得到逐帧的声学特征序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111088449.4/2.html,转载请声明来源钻瓜专利网。





