[发明专利]机器学习人工智能翻译数据库的更新方法有效
申请号: | 201810873984.2 | 申请日: | 2018-08-02 |
公开(公告)号: | CN109241539B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 王大江 | 申请(专利权)人: | 爱云保(上海)科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/242;G06F40/30;G06F16/33;G06F16/36;G06F16/23;G10L15/00;G10L15/06;G10L15/26 |
代理公司: | 成都贞元会专知识产权代理有限公司 51390 | 代理人: | 韩敏 |
地址: | 200050 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 人工智能 翻译 数据库 更新 方法 | ||
为了进一步提高在线翻译时的效率和准确性,从而提高翻译数据库的更新效率,本发明提供了一种机器学习人工智能翻译数据库的更新方法,包括(10)以机器学习方式建立词语库;(20)建立人工智能语音预测模型;(30)将待翻译的语音转换成文字;(40)根据所述词语库和语音预测模型,确定译文文字。本发明能够通过机器学习得到的大数据外文‑中文对照词典,基于6阶深度概率分析方法进行语义和语境的匹配,从而相比现有技术的做法降低了超过40%以上的运算量,在确保翻译准确性的同时提高了翻译效率和更新效率。
技术领域
本发明涉及语音控制技术领域,更具体地,涉及一种机器学习人工智能翻译数据库的更新方法。
背景技术
随着科学技术的发展和经济全球化,无论是在日常生活中还是学术领域沟通上,在线翻译交流已经存在越来越多的需求。尽管已经存在同声传译、便携式机器翻译设备等应运而生,但在涉及专业领域的会议或课堂等的使用场景里,传统机器翻译设备的准确度以及同声传译人员的效率是令人堪忧的。尤其是当某方语速较快时,机器翻译将难以胜任,而同声传译人员则需要使用重新确认的方式复述没有跟上的语言,从而给一些使用场景带来不顺畅的体验。
为了同时满足在线翻译的效率和准确性的提高需求,申请号为CN201710203439.8的中国发明专利申请公开了一种多语言智能预处理实时统计机器翻译系统,包括:接收模块、预处理模块、机器翻译模块和后处理模块。所述接收模块包括文本语言接收模块和语音识别结果接收模块;所述预处理模块包括文本预处理模块和语音识别结果预处理模块;机器翻译模块,所述机器翻译模块用于学习短语对短语的翻译,并对经过预处理模块处理的短语找出对应的翻译短语,以及把短语连接成完整的句子;后处理模块,所述后处理模块用于对翻译结果做单词标点规范化、大小写规范化和格式规范化处理,使其更加接近目标语言的表达习惯,并作为最终结果输出。然而,这种系统对于现有技术的上述弊端解决力度有限。
发明内容
为了进一步提高在线翻译时的效率和准确性,从而提高翻译数据库的更新效率,本发明提供了一种机器学习人工智能翻译数据库的更新方法,包括:
(10)以机器学习方式建立词语库;
(20)建立人工智能语音预测模型;
(30)将待翻译的语音转换成文字;
(40)根据所述词语库和语音预测模型,确定译文文字;
(50)对译文文字进行校正,并根据校正结果更新所述词语库。
进一步地,所述步骤(10)包括:利用机器学习方式,根据词典建立外文词语和与该外文词语对应的中文含义的词语之间的第一关联,其中中文词语的译文为多个时以词典中的第一顺序位置标识的中文译文词语为主要中文译文词语而之后顺序位置的中文译文词语作为次要中文译文词语。
进一步地,所述步骤(20)包括:
(201)根据外文文章进行切词得到外文词语并根据该外文文章的中文译文词语,建立外文词语和中文译文词语以及该中文译文词语之后接续的二级词语的第二关联;
(202)将第一关联和第二关联进行索引;
进一步地,所述步骤(201)包括:根据外文文章以无监督学习方式进行机器学习。
进一步地,所述步骤(201)包括:采用随机梯度下降法对外文文章及其译文进行机器学习。
进一步地,所述步骤(202)包括:
以第一关联为主键,从第二关联中出现的与第一关联相关的信息进行索引。
进一步地,所述以第一关联为主键,从第二关联中出现的与第一关联相关的信息进行索引包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱云保(上海)科技有限公司,未经爱云保(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810873984.2/2.html,转载请声明来源钻瓜专利网。