[发明专利]一种翻译模型压缩方法、翻译方法及相关装置在审
申请号: | 202210344547.8 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114662485A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 徐浩广 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/58 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 翻译 模型 压缩 方法 相关 装置 | ||
1.一种翻译模型压缩方法,包括:
从训练得到的目标翻译模型中提取词表向量集合,其中,所述词表向量集合中的词表向量的元素呈正态分布;
基于所述词表向量集合映射的正态分布结果确定量化区间;
根据确定的量化精度,计算待划分的区间段数目,按照等分的方式将所述量化区间划分为与所述区间段数目相同的多个量化区间段,并为每个量化区间段分配一个唯一区间编号;
分别将每个量化区间段内包含的词表向量的元素对应的原值用对应的量化区间段的区间编号进行替换,并将以区间编号表示的词表向量写入所述目标翻译模型;
其中,所述区间编号的比特位小于所述原值的比特位。
2.如权利要求1所述的翻译模型压缩方法,基于所述词表向量集合映射的正态分布结果确定量化区间,包括:
基于所述词表向量集合映射的正态分布中,选择满足预设约束条件的词表向量分布区间作为量化区间。
3.如权利要求2所述的翻译模型压缩方法,所述预设约束条件包括:词表向量集合中全部词表向量;
基于所述词表向量集合映射的正态分布中,选择满足预设约束条件的词表向量分布区间作为量化区间,包括:
基于所述词表向量集合映射的正态分布情况,选择全部词表向量所对应的词表向量分布区间作为量化区间,其中,所述量化区间的最大边界为所述词表向量集合中最大元素的原值,最小边界为所述词表向量集合中最小元素的原值。
4.如权利要求2所述的翻译模型压缩方法,所述预设约束条件包括:词表向量集中程度满足约束子条件;
基于所述词表向量集合映射的正态分布中,选择满足预设约束条件的词表向量分布区间作为量化区间,包括:
基于所述词表向量集合映射的正态分布情况,从中选择词表向量集中程度满足约束子条件的词表向量分布区间作为量化区间;
其中,所述约束子条件包括:词表向量分布区间的最大边界处的元素的取值满足第一阈值和/或最小边界处的元素的取值满足第二阈值;或者,词表向量分布区间的最大边界处的元素的密度满足第三阈值和/或最小边界处的元素的密度满足第四阈值。
5.如权利要求1-3任一项所述的翻译模型压缩方法,所述区间段数目为N,且所述N为正整数;
则根据确定的量化精度,计算待划分的区间段数目,按照等分的方式将所述量化区间划分为与所述区间段数目相同的多个量化区间段,并为每个量化区间段分配一个唯一区间编号,包括:
将确定的量化精度作为底数2的指数进行计算,并对计算结果减1后得到待划分的区间段数目N;按照等分的方式将所述量化区间均匀划分为N个量化区间段,并使用0至N-1中每个正整数为每个量化区间段分别赋予一个区间编号。
6.如权利要求1-2、4任一项所述的翻译模型压缩方法,所述区间段数目为N,且所述N为正整数;
则根据确定的量化精度,计算待划分的区间段数目,按照等分的方式将所述量化区间划分为与所述区间段数目相同的多个量化区间段,并为每个量化区间段分配一个唯一区间编号,包括:
将确定的量化精度作为底数2的指数进行计算,并对计算结果减1后得到待划分的区间段数目N;按照等分的方式将所述量化区间均匀划分为N个量化区间段,并使用0至N-1中每个正整数为每个量化区间段分别赋予一个区间编号;以及,为所述量化区间以外的分布区间统一赋予特殊编号N。
7.如权利要求6所述的翻译模型压缩方法,在将以区间编号表示的词表向量写入所述目标翻译模型之后,所述方法还包括:
分别将所述量化区间以外的分布区间包含的词表向量以对应的原值写入所述目标翻译模型,并使用特殊编号N进行统一标记。
8.如权利要求1-4任一项所述的翻译模型压缩方法,所述量化区间是对称分布区间,或者,非对称分布区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210344547.8/1.html,转载请声明来源钻瓜专利网。