[发明专利]神经网络模型预测方法、装置和终端有效
申请号: | 201811543424.7 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109492759B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 陈雅雪;方晓敏;王凡;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 预测 方法 装置 终端 | ||
1.一种神经网络模型预测方法,其特征在于,包括:
在神经网络模型中构建多条输出支路,包括:在神经网络模型中的输出层与全连接层之间构建遮罩层,所述遮罩层包括多个遮罩值,一个所述遮罩值对应一个输出支路;每条所述输出支路共用所述神经网络模型的神经网络,且每条所述输出支路与共用的神经网络构成一个独立的神经网络结构;
将特征数据输入至神经网络模型中,选择至少一条所述输出支路输出预测分数,所述特征数据为包括新闻类型的特征数据,所述预测分数包括根据所述新闻类型的特征数据对应的点击率确定的预测分数;
根据所述输出支路输出的所有预测分数进行计算,输出最终预测结果。
2.如权利要求1所述的方法,其特征在于,在神经网络模型中构建多条输出支路,包括:
在所述神经网络模型中的输出层与全连接层之间构建遮罩层,所述遮罩层包括多个遮罩值,一个所述遮罩值对应一个所述输出支路。
3.如权利要求2所述的方法,其特征在于,在所述神经网络模型中的输出层与全连接层之间构建遮罩层之后,还包括:
当所述遮罩值为第一定值时,允许所述预测分数沿对应的输出支路前向传播或后向传播;
当所述遮罩值为第二定值时,禁止所述预测分数沿对应的输出支路前向传播或后向传播,所述第一定值和所述第二定值不同。
4.如权利要求3所述的方法,其特征在于,选择至少一条所述输出支路输出预测分数,包括:
从所述遮罩值为第一定值对应的输出支路中选择至少一条,输出所述预测分数。
5.如权利要求4所述的方法,其特征在于,根据所述输出支路输出的预测分数进行计算之前,还包括:
将选择的输出支路输出的预测分数输入至误差层,生成误差值,以使所述误差值后传播时,根据所述误差值更新所述神经网络模型的各层参数。
6.如权利要求1所述的方法,其特征在于,根据所述输出支路输出的预测分数进行计算,输出最终预测结果,包括:
对所述输出支路输出的预测分数计算平均值,输出最终预测结果;
或,在所有所述输出支路输出的预测分数中选择数值大于阈值的预测分数,输出最终预测结果。
7.一种神经网络模型预测装置,其特征在于,包括:
多输出支路构建模块,用于在神经网络模型中构建多条输出支路,包括:在神经网络模型中的输出层与全连接层之间构建遮罩层,所述遮罩层包括多个遮罩值,一个所述遮罩值对应一个输出支路;每条所述输出支路共用所述神经网络模型的神经网络,且每条所述输出支路与共用的神经网络构成一个独立的神经网络结构;
输出支路选择模块,用于将特征数据输入至神经网络模型中,选择至少一条所述输出支路输出预测分数,所述特征数据为包括新闻类型的特征数据,所述预测分数包括根据所述新闻类型的特征数据对应的点击率确定的预测分数;
预测分数计算模块,用于根据所述输出支路输出的所有预测分数进行计算,输出最终预测结果。
8.如权利要求7所述的装置,其特征在于,所述多输出支路构建模块包括:
遮罩层构建单元,用于在所述神经网络模型中的输出层与全连接层之间构建遮罩层,所述遮罩层包括多个遮罩值,一个所述遮罩值对应一个所述输出支路。
9.如权利要求8所述的装置,其特征在于,所述多输出支路构建模块还包括:
遮罩值设置单元,用于当所述遮罩值为第一定值时,允许所述预测分数沿对应的输出支路前向传播或后向传播,当所述遮罩值为第二定值时,禁止所述预测分数沿对应的输出支路前向传播或后向传播,所述第一定值和所述第二定值不同。
10.如权利要求9所述的装置,其特征在于,所述输出支路选择模块包括:
遮罩值选择单元,用于从所述遮罩值为第一定值对应的输出支路中选择至少一条,输出所述预测分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811543424.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:资料预报方法及系统
- 下一篇:基于深度模糊认知图模型的道路交通可解释预测方法