[发明专利]一种跨媒体数据共享表示方法及用户行为分析方法、系统在审
| 申请号: | 202010562482.5 | 申请日: | 2020-06-18 |
| 公开(公告)号: | CN111708745A | 公开(公告)日: | 2020-09-25 |
| 发明(设计)人: | 贾全烨;闫龙川;高德荃;赵子岩;黄震 | 申请(专利权)人: | 全球能源互联网研究院有限公司;国家电网有限公司信息通信分公司;国家电网有限公司;国网山东省电力公司 |
| 主分类号: | G06F16/176 | 分类号: | G06F16/176;G06F21/62;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 胡晓静 |
| 地址: | 102209 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 媒体 数据 共享 表示 方法 用户 行为 分析 系统 | ||
1.一种跨媒体数据共享表示方法,其特征在于,包括:
获取跨媒体数据,所述跨媒体数据包括图像和文本两种类型的媒体数据;
使用多模式深度置信网络对所述跨媒体数据中每种媒体类型进行媒体间独立表征学习,得到每种媒体类型对应的媒体间独立表示;
使用堆叠式自动编码器对所述跨媒体数据进行媒体内独立表征学习,得到每种媒体类型对应的媒体内独立表示;
将所述每种媒体类型对应的所述媒体间独立表示和所述媒体内独立表示进行分层组合,得到所述跨媒体数据的共享表示;
所述使用多模式深度置信网络对所述跨媒体数据中每种媒体类型进行媒体间独立表征学习,得到每种媒体类型对应的媒体间独立表示,包括:
通过两个完全相同的双层深度置信网络分别对每种媒体类型进行建模,所述双层深度置信网络由高斯受限玻尔兹曼机和软副本模型构成,其中,高斯受限玻尔兹曼机用于对图像特征的分布进行建模,软副本模型用于对文本特征的分布进行建模;
使用受限玻尔兹曼机设置在所述两个双层深度置信网络的顶部,对两种媒体类型的数据联合分布进行建模,得到每种媒体类型对应的媒体间独立表示;
将所述每种媒体类型对应的所述媒体间独立表示和所述媒体内独立表示进行分层组合,得到所述跨媒体数据的共享表示,包括:
使用联合受限玻尔兹曼机将每种媒体类型对应的所述媒体间独立表示和所述媒体内独立表示进行结合,得到每种媒体类型的联合层中间表示;
使用多个堆叠的双峰自动编码对每种媒体类型的联合层中间表示进行跨媒体相关性的学习,得到所述跨媒体数据的共享表示。
2.根据权利要求1所述的跨媒体数据共享表示方法,其特征在于,利用最小化重构误差对所述堆叠式自动编码器进行训练,得到每种媒体类型对应的媒体内独立表示。
3.一种用户行为分析方法,包括:
获取用户发送的待分析数据,所述待分析数据为用户采用如权利要求1-2任一项所述的跨媒体数据共享表示方法对包含用户行为的跨媒体数据进行处理,得到的共享表示数据;
采用基于离群点检测的差分隐私K-means算法对所述待分析数据进行用户行为分析,得到分析结果。
4.根据权利要求3所述的用户行为分析方法,其特征在于,所述采用基于离群点检测的差分隐私K-means算法对所述待分析数据进行用户行为分析,得到分析结果,包括:
步骤S201:计算所述待分析数据中各个数据点对应的密度值,根据所述密度值的排序结果标记离群点,并根据所述密度值对剔除离群点后的所述待分析数据进行分簇,并确定每一簇的初始中心点;
步骤S202:计算所述待分析数据中每个数据点到所有初始中心点的欧式距离,并将该数据点划入欧式距离最小的初始中心点所在的簇中,形成分簇结果;
步骤S203:对剔除离群点后的所述待分析数据添加拉普拉斯噪声,并根据添加拉普拉斯噪声后的待分析数据重新计算所述分簇结果中的每一簇对应的中心点,得到更新后的中心点;
步骤S204:计算分簇结果中的每一簇对应的权重,根据所述权重及所述待分析数据中各数据点与各更新后的中心点的相对距离,重新进行聚类划分,并返回上述步骤S203,直至分簇结果满足预设收敛条件。
5.根据权利要求4所述的用户行为分析方法,其特征在于,所述密度值通过如下公式计算:
其中,density(x)表示待分析数据中数据点x对应的密度值,n表示待分析数据中数据点的个数,dist2(x,yi)表示,数据点x与数据点yi之间的欧式距离的平方值,i和n均为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院有限公司;国家电网有限公司信息通信分公司;国家电网有限公司;国网山东省电力公司,未经全球能源互联网研究院有限公司;国家电网有限公司信息通信分公司;国家电网有限公司;国网山东省电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010562482.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的养牛方法
- 下一篇:一种驱动器中制动电阻温度的检测方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





