[发明专利]一种基于深度多任务学习的活动和用户识别方法有效
申请号: | 201911355355.1 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111160443B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 陈岭;张毅 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06N3/045;G06N3/0442;G06N3/047;G06N3/084 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 任务 学习 活动 用户 识别 方法 | ||
1.一种基于深度多任务学习的活动和用户识别方法,包括以下步骤:
(1)利用可穿戴传感器采集各用户活动时的传感器数据,并进行预处理得到数据样本x,将数据样本x和对应的活动标签a和用户标签u作为训练样本,并构建训练样本集;
(2)从训练样本集中选择部分训练样本,来联合构建用于预测活动和用户的活动识别网络和用户识别网络,其中,活动识别网络和用户识别网络共享部分隐参数,并引入相互注意力机制,利用对方学习到的知识为特征各部分赋予权重,包括:
(2-1)从训练样本集中选择部分训练样本;
(2-2)利用活动识别网络和用户识别网络中两个独立的卷积神经网络分别处理数据样本x,得到样本的中间层特征表示ra和ru;
(2-3)将中间层特征表示ra和ru展开为长度为l的向量序列,并分别输入到活动识别网络和用户识别网络中两个独立的双向长短时记忆网络,以提取时间依赖关系得到特征表示向量序列和其中,中间层特征表示ra和ru的时间维保持不变,其它维展开,两个双向长短时记忆网络具有相同的网络架构,均包含一个双向长短时记忆网络层,双向长短时记忆网络层将方向相反的两个长短时记忆网络层连接到同一输出,一个长短时记忆网络层前向处理输入序列,另一个后向处理,输出可以同时获取前向和后向的时间依赖关系;
(2-4)利用活动识别网络和用户识别网络中两个独立的注意力网络,将特征表示向量序列ea映射到权重向量为特征表示向量序列eu各部分赋予权重;将特征表示向量序列eu映射到权重向量为特征表示向量序列ea各部分赋予权重;
(2-5)利用活动识别网络中的由全连接网络层和softmax函数构成的活动分类输出层,根据特征表示的加权和αa得到活动预测结果a′;利用用户识别网络中的由全连接网络层和softmax函数构成的用户分类输出层,根据特征表示的加权和αu得到用户预测结果u′;
(2-6)根据活动预测和活动标签计算活动分类损失,根据用户预测和用户标签计算用户分类损失,并依据损失更新网络各部分的参数;
(2-7)将被更新过的两个卷积神经网络对应卷积网络层的卷积核堆叠,构成高阶张量,并通过Tucker分解得到初始的隐参数,包括:
每个卷积网络层的卷积核可以表示为一个d1×d2×d3维三阶张量,将两个卷积神经网络对应卷积网络层的卷积核堆叠构成一个d1×d2×d3×d4维四阶张量T,其中,d4=2,对张量T进行Tucker分解从而得到初始的隐参数,如公式(1)所示:
T=S·(1,2)R(1)·(1,2)R(2)·(1,2)R(3)·(1,2)R(4) (1)
其中,S是一个v1×v2×v3×v4维四阶张量,R(i)是一个di×vi维矩阵,S和R均为初始的隐参数,R(4)表示活动识别网络和用户识别网络特有的隐参数,S,R(1),R(2),和R(3)表示活动识别网络和用户识别网络共享的隐参数,下标·(i,j)表示执行张量点积操作的坐标轴;
(3)从训练样本集中选择部分训练样本,来构建联合损失对活动识别网络和用户识别网络进行协同优化,得到参数确定的活动识别模型和用户识别模型;
(4)将预处理后的传感器数据输入至活动识别模型和用户识别模型中,利用活动识别模型获得活动识别结果,利用用户识别模型获得用户识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911355355.1/1.html,转载请声明来源钻瓜专利网。