[发明专利]一种业务模型的训练方法、训练装置和计算设备在审
| 申请号: | 202211186475.5 | 申请日: | 2022-09-26 |
| 公开(公告)号: | CN115423120A | 公开(公告)日: | 2022-12-02 |
| 发明(设计)人: | 戴全宇;王浩;王奕超;唐睿明;董振华 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 业务 模型 训练 方法 装置 计算 设备 | ||
1.一种业务模型的训练方法,其特征在于,所述业务模型包括表征网络和预测网络;所述方法包括:
获取用户集中各个用户的特征数据和事实结果,所述用户集中包括接受第一策略的第一用户、以及接受第二策略的第二用户;
使用所述表征网络处理所述各个用户的特征数据得到所述各个用户的表征数据,以及利用所述预测网络处理所述各个用户的表征数据得到所述各个用户的预测事实结果;
根据所述各个用户的事实结果和预测事实结果确定第一损失;
基于最优传输求解算法获得的优化的传输矩阵确定所述第一用户与所述第二用户的样本分布距离,其中,所述优化的传输矩阵根据所述第一用户和第二用户的目标质量分布向量确定;
根据所述第一损失和第二损失更新所述业务模型的模型参数,所述第二损失根据所述样本分布距离确定。
2.根据权利要求1所述的方法,其特征在于,所述基于最优传输求解算法获得的优化的传输矩阵确定所述第一用户与所述第二用户的样本分布距离包括:
根据所述第一用户的表征数据和所述第二用户的表征数据确定距离矩阵;
确定所述优化的传输矩阵,其为使得目标项最小化的传输矩阵,所述目标项正相关于第一距离项和第二距离项,所述第一距离项为所述距离矩阵与传输矩阵的点乘结果,第二距离项包括:基于所述传输矩阵确定的传输质量分布与所述第一用户和第二用户的目标质量分布向量之间的分布差异;
根据所述距离矩阵和所述优化的传输矩阵,确定所述样本分布距离。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:预测所述第一用户接受第二策略时的反事实结果、以及所述第二用户接受所述第一策略时的反事实结果;
其中,所述根据所述第一用户的表征数据和所述第二用户的表征数据确定距离矩阵包括:根据所述第一用户的表征数据与所述第二用户的表征数据的差值、所述第一用户的事实结果与所述第二用户的反事实结果的差值、以及所述第二用户的事实结果与所述第一用户的反事实结果的差值,确定所述距离矩阵。
4.根据权利要求2或3所述的方法,其特征在于,所述分布差异为以下两项之和:
根据所述传输矩阵确定的对应于所述第一用户的第一传输质量分布向量与其目标质量分布向量之间的第一KL散度,以及,
根据所述传输矩阵确定的对应于所述第二用户的第二传输质量分布向量与其目标质量分布向量之间的第二KL散度。
5.根据权利要求4所述的方法,其特征在于,所述确定优化的传输矩阵包括多轮迭代运算,任意轮迭代运算包括:
根据当前轮次中当前传输矩阵确定当前的第一传输质量分布向量,根据当前的第一传输质量分布向量和所述第一用户的目标质量分布向量之间的当前分布差,更新第一向量;
根据所述当前传输矩阵确定当前的第二传输质量分布向量,根据当前的第二传输质量分布向量和所述第二用户的目标质量分布向量之间的当前分布差,更新第二向量;
其中,所述第一向量和所述第二向量用于在多轮迭代后,运算得出所述优化的传输矩阵。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第一策略为接受目标干预操作,第二策略为不接受所述目标干预操作。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述第一损失和第二损失更新所述业务模型的模型参数包括:
根据所述第一损失值、所述第二损失值和所述第二损失值的权重确定总损失值;
根据所述总损失值更新所述业务模型的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211186475.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发光二极管及发光装置
- 下一篇:全自动高速平行光曝光装置





