[发明专利]译文质检抽取方法、装置、计算机设备和存储介质在审
申请号: | 202010160759.1 | 申请日: | 2020-03-10 |
公开(公告)号: | CN111507869A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 虞朋鑫 | 申请(专利权)人: | 文思海辉智科科技有限公司 |
主分类号: | G06Q50/20 | 分类号: | G06Q50/20;G06Q10/06 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 孙岩 |
地址: | 102200 北京市昌平区未来科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 译文 质检 抽取 方法 装置 计算机 设备 存储 介质 | ||
1.一种译文质检抽取方法,其特征在于,所述方法包括:
获取至少一个已翻译字串;
根据历史质检评分,获取质量抽检比例;所述质量抽检比例为对所述至少一个已翻译字串的翻译质量进行抽样检查的比例;
根据所述质量抽检比例,对所述至少一个已翻译字串进行抽取,得到待质检字串。
2.根据权利要求1所述的方法,其特征在于,所述根据所述质量抽检比例,对所述至少一个已翻译字串进行抽取,得到待质检字串,包括:
确定所述至少一个已翻译字串中的当前待抽取字串;
生成针对所述当前待抽取字串的抽取随机数,并根据所述质量抽检比例确定抽取数值范围;
当所述抽取随机数符合所述抽取数值范围时,确定所述当前待抽取字串为所述待质检字串,对所述当前待抽取字串执行抽取操作。
3.根据权利要求1所述的方法,其特征在于,所述根据历史质检评分,获取质量抽检比例,包括:
获取所述历史质检评分;所述历史质检评分为通过对历史已翻译文本进行质检得到的:
根据所述历史质检评分,在预设的抽取比例列表中,确定目标质量抽检比例,作为所述质量抽检比例;其中,所述抽取比例列表记录有所述历史质检评分与所述质量抽检比例之间的对应关系。
4.根据权利要求3所述的方法,其特征在于,所述历史质检评分具有多个;所述目标历史质检评分对应的时间截符合预设条件。
5.根据权利要求1所述的方法,其特征在于,所述根据所述质量抽检比例,对所述至少一个已翻译字串进行抽取,得到待质检字串,包括:
在所述至少一个已翻译字串中,确定当前待抽取字串;
实时获取实际已抽检比例,并将所述实际已抽检比例与所述质量抽检比例进行对比,确定是否对所述当前待抽取字串执行抽取操作,以调整所述实际已抽检比例符合预设的目标抽检比例范围。
6.根据权利要求5所述的方法,其特征在于,所述将所述实际已抽检比例与所述质量抽检比例进行对比,确定是否对所述当前待抽取字串执行抽取操作,包括:
获取合理偏离抽取比例;
根据所述质量抽检比例和所述合理偏离抽取比例,确定针对所述当前待抽取字串的第一抽检比例范围;
若所述实际已抽检比例小于所述第一抽检比例范围的下限,则确定所述当前待抽取字串为所述待质检字串,对所述当前待抽取字串执行抽取操作。
7.根据权利要求6所述的方法,其特征在于,若所述实际已抽检比例大于所述第一抽检比例范围的上限,则不对所述当前待抽取字串执行抽取操作。
8.根据权利要求5所述的方法,其特征在于,所述实时获取实际已抽检比例,包括:
实时获取当前已翻译总字数,以及,实时获取当前已质检字数;
根据所述当前已翻译总字数和所述当前已质检字数,确定所述实际已抽检比例。
9.根据权利要求8所述的方法,其特征在于,所述根据所述当前已翻译总字数和所述当前已质检字数,确定所述实际已抽检比例,包括:
获取当前待抽取字串的字串字数;
对所述当前已质检总字数与所述字串字数进行相加,得到第一字数,以及,对所述已翻译总字数与所述字串字数进行相加,得到第二字数;
计算所述第一字数与所述第二字数的比值,得到所述实际已抽检比例。
10.根据权利要求1所述的方法,其特征在于,还包括:
获取针对所述待质检字串的字串分配策略;
根据所述字串分配策略,下发所述待质检字串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于文思海辉智科科技有限公司,未经文思海辉智科科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010160759.1/1.html,转载请声明来源钻瓜专利网。