[发明专利]标签联合概率分析方法及系统有效
申请号: | 202110454629.3 | 申请日: | 2021-04-26 |
公开(公告)号: | CN112990985B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 吴新宇;孙静 | 申请(专利权)人: | 北京楚梵基业科技有限公司 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06F16/2457;G06N3/0464 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 牛晴 |
地址: | 101149 北京市通*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 联合 概率 分析 方法 系统 | ||
1.一种标签联合概率分析方法,其特征在于,包括:
通过多种渠道获取标签数据,根据每个渠道对应的渠道权重计算所述标签数据的概率分布,生成标签概率统计表;
对所有标签数据进行分组组合,根据标签组合对所述标签概率统计表进行拆分得到多个标签概率子表,计算所有标签概率子表的联合概率;
综合所有标签概率子表的联合概率计算获取标签概率矩阵;
所述对所有标签数据进行分组组合,根据标签组合对所述标签概率统计表进行拆分得到多个标签概率子表,包括:
将每个用户的三个标签数据进行标签组合,合成标签三元组;
根据标签三元组对所述标签概率统计表进行拆分得到多个标签概率子表;
所述计算所有标签概率子表的联合概率,包括:
计算所述标签三元组的相对熵;其中,所述相对熵的计算公式为:
结合所述标签组合中预设的有效标签的相对熵权重和标签三元组的相对熵计算所有标签概率子表的联合概率;计算公式为:
其中,A、B、C表示标签属性;KL(Pi||Pθ)表示标签三元组的相对熵;Pi表示用户i的概率;Al表示A标签属性的l标签;Bm表示B标签属性的m标签;Cn表示C标签属性的n标签;表示标签概率子表的联合概率;λi是用户i的有效标签的相对熵权重;
所述综合所有标签概率子表的联合概率计算获取标签概率矩阵,包括:
将所述所有标签概率子表的联合概率分解为基于所述标签属性的单元概率函数的连乘与用于计算残差的神经网络函数的和,计算公式为
其中,所述单元概率函数的计算公式为:
其中,A(in)单元概率函数、Z是归一化因子。
2.根据权利要求1所述的方法,其特征在于,确定所述单元概率函数与用于计算残差的神经网络函数后,如果已知任意标签组合X,那么对任意未知标签组合Y求解条件概率;计算公式为
3.根据权利要求2所述的方法,其特征在于,还包括:
实时根据训练或实践结果迭代更新训练权重,以更新用于计算残差的神经网络函数。
4.一种标签联合概率分析系统,其特征在于,包括:
生成模块,用于通过多种渠道获取标签数据,根据每个渠道对应的渠道权重计算所述标签数据的概率分布,生成标签概率统计表;
拆分模块,用于对所有标签数据进行分组组合,根据标签组合对所述标签概率统计表进行拆分得到多个标签概率子表,计算所有标签概率子表的联合概率;
计算模块,用于综合所有标签概率子表的联合概率计算获取标签概率矩阵;
所述对所有标签数据进行分组组合,根据标签组合对所述标签概率统计表进行拆分得到多个标签概率子表,包括:
将每个用户的三个标签数据进行标签组合,合成标签三元组;
根据标签三元组对所述标签概率统计表进行拆分得到多个标签概率子表;
所述计算所有标签概率子表的联合概率,包括:
计算所述标签三元组的相对熵;其中,所述相对熵的计算公式为:
结合所述标签组合中预设的有效标签的相对熵权重和标签三元组的相对熵计算所有标签概率子表的联合概率;计算公式为:
其中,A、B、C表示标签属性;KL(Pi||Pθ)表示标签三元组的相对熵;Pi表示用户i的概率;Al表示A标签属性的l标签;Bm表示B标签属性的m标签;Cn表示C标签属性的n标签;表示标签概率子表的联合概率;λi是用户i的有效标签的相对熵权重;
所述综合所有标签概率子表的联合概率计算获取标签概率矩阵,包括:
将所述所有标签概率子表的联合概率分解为基于所述标签属性的单元概率函数的连乘与用于计算残差的神经网络函数的和,计算公式为
其中,所述单元概率函数的计算公式为:
其中,A(in)单元概率函数、Z是归一化因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京楚梵基业科技有限公司,未经北京楚梵基业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110454629.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蒸饭机用开水器
- 下一篇:一种基于预训练模型和位置信息的文本结构化方法