[发明专利]一种数据处理方法、装置和电子设备在审
| 申请号: | 201911136852.2 | 申请日: | 2019-11-19 |
| 公开(公告)号: | CN112825247A | 公开(公告)日: | 2021-05-21 |
| 发明(设计)人: | 黄海兵;邱晓杰 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/30;G10L19/04;G10L25/12 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 郑傲日 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 电子设备 | ||
1.一种数据处理方法,其特征在于,包括:
获取训练数据;
判断所述训练数据是否具有训练共享语言模型的训练价值;
若所述训练数据具有训练价值,则通过所述训练数据训练所述共享语言模型更新所述共享语言模型的模型参数,并将更新的模型参数上传至服务器。
2.根据权利要求1所述的方法,其特征在于,所述训练数据包括训练文本和参考结果;所述判断所述训练数据是否具有训练共享语言模型的训练价值,包括:
将所述训练文本输入至所述共享语言模型中进行前向计算,得到预测结果;
依据所述预测结果和所述参考结果,判断所述训练数据是否具有训练共享语言模型的训练价值。
3.根据权利要求2所述的方法,其特征在于,所述预测结果包括预测文本和对应的预测概率;所述依据所述预测结果和所述参考结果,判断所述训练数据是否具有训练共享语言模型的训练价值,包括:
判断预测概率最大的预测文本与参考样本是否匹配;
若预测概率最大的预测文本与参考文本不匹配,则确定所述训练数据具有训练共享语言模型的训练价值。
4.根据权利要求3所述的方法,其特征在于,所述参考结果还包括参考文本对应的参考概率,所述通过所述训练数据训练所述共享语言模型更新所述共享语言模型的模型参数,包括:
确定与参考文本匹配的预测文本的预测概率,以及所述匹配的预测文本的预测概率与参考文本对应参考概率的误差;
依据所述误差对所述共享语言模型进行反向学习,更新所述共享语言模型的模型参数。
5.根据权利要求2所述的方法,其特征在于,所述的方法还包括:
若所述训练数据不具有训练价值,则舍弃所述训练数据。
6.根据权利要求1所述的方法,其特征在于,所述的方法还包括:
获取模型参数更新后的共享语言模型,所述共享语言模型的模型参数由服务器根据各终端设备上传的模型参数进行更新。
7.根据权利要求1-6任一所述的方法,其特征在于,所述训练数据包括与用户输入相关的信息。
8.一种数据处理装置,其特征在于,包括:
训练数据获取模块,用于获取训练数据;
判断模块,用于判断所述训练数据是否具有训练共享语言模型的训练价值;
更新模块,用于若所述训练数据具有训练价值,则通过所述训练数据训练所述共享语言模型更新所述共享语言模型的模型参数,并将更新的模型参数上传至服务器。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7任一所述的数据处理方法。
10.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取训练数据;
判断所述训练数据是否具有训练共享语言模型的训练价值;
若所述训练数据具有训练价值,则通过所述训练数据训练所述共享语言模型更新所述共享语言模型的模型参数,并将更新的模型参数上传至服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911136852.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种玉米种植方法
- 下一篇:测距方法、测距装置及电子设备





