[发明专利]一种数据处理方法、装置、设备及存储介质在审
申请号: | 201910120032.8 | 申请日: | 2019-02-18 |
公开(公告)号: | CN111582898A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 董健;常富洋;颜水成 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q40/06 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 王玉双 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 设备 存储 介质 | ||
本说明书实施例提供了一种数据处理方法、装置、设备及存储介质。其方法包括:接收目标用户的事件触发消息,其息中携带所述目标用户的标识信息;根据所述目标用户的标识信息,获取目标用户的用户画像;获取预设的由多个行为激励指数划分得到的行为激励指数区间;将用户画像作为增强学习模型的输入,利用增强学习模型分别获取目标用户在每个行为激励指数区间对应的预估行为概率和预估不确定性值;选择预估行为概率与预估不确定性之和最大的行为激励指数区间中的目标行为激励指数;发送所述目标用户的行为激励指示消息,其中携带表示所述目标行为激励指数的数据。本发明实施例可准确预估行为激励指数。
技术领域
本说明书实施例涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
近些年,互联网金融蓬勃发展,互联网金融相对于传统金融机构有着小额、高频等特点。在互联网金融中,可以通过很多促销活动触达用户,例如,理财产品中的优惠券,货代产品中的降低利率、提额等措施。为了提高用户的动支率且降低金融风险,通常针对不同的用户配置不同的促销活动,进行金融行为激励。
目前普遍采用的方式是通过工作人员凭经验进行行为激励的配置,导致其处理效率低。
发明内容
本说明书实施例提供及一种数据处理方法、装置、设备及存储介质,实现智能行为激励指数调整,提高处理效率。
第一方面,本说明书实施例提供一种数据处理方法,包括:
接收目标用户的事件触发消息,所述事件触发消息中携带所述目标用户的标识信息;
根据所述目标用户的标识信息,获取所述目标用户的用户画像;
获取预设的由多个行为激励指数划分得到的行为激励指数区间;
将所述用户画像作为增强学习模型的输入,利用增强学习模型分别获取所述目标用户在每个行为激励指数区间对应的预估行为概率和预估不确定性值;
选择预估行为概率与预估不确定性之和最大的行为激励指数区间中的目标行为激励指数,所述目标行为激励指数为最大的所述预估行为概率与预估不确定性之和对应的行为激励指数;
发送所述目标用户的行为激励指示消息,所述行为激励指示消息中携带表示所述目标行为激励指数的数据。
结合第一方面,在本发明实施例第一方面的第一种实现方式中,所述增强学习模型包括线性模型和上下文赌博机,所述利用增强学习模型分别获取所述目标用户在每个行为激励指数区间对应的预估行为概率和预估不确定性值,包括:
利用所述线性模型分别获取每个行为激励指数区间对应的预估行为概率;
利用所述上下文赌博机分别获取每个行为激励指数区间对应的预估不确定性值。
结合第一方面的第一种实现方式,在本发明实施例第一方面的第二种实现方式中,所述用户画像中包括第一用户画像特征,所述利用所述线性模型分别获取每个行为激励指数区间对应的预估行为概率,包括:
获取所述第一用户画像特征;
将所述第一用户画像特征、每个行为激励指数区间各自的行为激励指数作为输入值,利用所述线性模型分别获取每个行为激励指数区间对应的预估行为概率。
结合第一方面的第二种实现方式,在本发明实施例第一方面的第三种实现方式中,所述第一用户画像特征包括以下至少一种:
目标用户所在区域数据,目标用户收入数据,目标用户学历数据。
结合第一方面的第一种实现方式,在本发明实施例第一方面的第四种实现方式中,所述用户画像包括第二用户画像特征,所述利用所述上下文赌博机分别获取每个行为激励指数区间对应的预估不确定性值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910120032.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:尺寸稳定性测试仪
- 下一篇:寻呼起始位置的确定方法、装置及终端