[发明专利]文本翻译方法、装置、设备及存储介质在审
申请号: | 202110839097.5 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113486680A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 卢春曦;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30;G06K9/62;G06F16/242;G06N3/04;G06N3/08;G06F16/27 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 杨毅玲;陈海云 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 翻译 方法 装置 设备 存储 介质 | ||
1.一种文本翻译方法,其特征在于,所述文本翻译方法包括:
当接收到文本翻译请求时,根据所述文本翻译请求获取待处理文本;
根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域;
根据所述分析领域获取初始翻译模型,并基于预设热词调整所述初始翻译模型,得到目标翻译模型;
基于所述目标翻译模型分析所述待处理文本,得到已翻译文本;
计算所述已翻译文本的文本通顺度;
若所述文本通顺度小于预设阈值,基于预先训练好的纠错模型对所述已翻译文本进行纠错处理,得到目标文本。
2.如权利要求1所述的文本翻译方法,其特征在于,所述根据所述文本翻译请求获取待处理文本包括:
解析所述文本翻译请求的报文,得到数据信息;
从所述数据信息中提取存储路径及文本编号;
将所述文本编号写入查询模板中,得到查询语句;
基于所述存储路径运行所述查询语句,得到所述待处理文本。
3.如权利要求1所述的文本翻译方法,其特征在于,所述根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域包括:
对所述待处理文本进行向量化处理,得到文本表征向量;
基于正向长短期记忆网络提取所述文本表征向量的正向特征,并基于反向长短期记忆网络提取所述文本表征向量的反向特征;
将所述正向特征及所述反向特征输入至预先训练好的语义识别模型中,得到所述文本语义;
计算所述文本语义与每个待选领域的领域相似度;
将所述领域相似度最高的待选领域确定为所述分析领域。
4.如权利要求1所述的文本翻译方法,其特征在于,所述基于预设热词调整所述初始翻译模型,得到目标翻译模型包括:
获取所述文本翻译请求的接收时间,并获取所述初始翻译模型的调整时间;
若所述调整时间有多个,从多个所述调整时间中选取与所述接收时间的时间差最小的时间作为更新时间;
根据所述更新时间及所述接收时间生成时间区间需求;
根据所述时间区间需求及预设标识从预设网站中获取所述预设热词及所述预设热词的翻译词汇;
基于所述初始翻译模型处理所述预设热词,得到预测词汇;
根据所述预测词汇与所述翻译词汇的词汇相似度调整所述初始翻译模型,直至所述词汇相似度不再升高,得到所述目标翻译模型。
5.如权利要求1所述的文本翻译方法,其特征在于,所述目标翻译模型包括编码器及解码器,所述基于所述目标翻译模型分析所述待处理文本,得到已翻译文本包括:
基于所述编码器对所述待处理文本中每个文本词汇进行编码处理,得到所述文本词汇的词向量;
分析每个文本词汇在所述待处理文本中的词汇权值;
基于所述词汇权值对所述词向量进行加权和运算,得到所述待处理文本的句向量;
基于所述解码器处理所述句向量,得到所述已翻译文本。
6.如权利要求1所述的文本翻译方法,其特征在于,所述计算所述已翻译文本的文本通顺度包括:
对于所述已翻译文本中每个目标词汇,获取所述目标词汇在所述已翻译文本中的最近邻词汇;
根据所述目标词汇与所述最近邻词汇在所述已翻译文本中的拼接关系生成组合词汇;
计算所述组合词汇在预设语料库中的词汇概率,并计算所述词汇概率的总和,得到所述已翻译文本的文本概率;
计算所述文本概率在所述已翻译文本的文本长度中的概率比值,并计算所述概率比值的倒数,得到所述文本通顺度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110839097.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种桃树施肥方法
- 下一篇:一种基于信息融合的风险评估方法和评估系统