[发明专利]一种激励决策模型的运动引导方法、装置和电子设备在审
申请号: | 202210745680.4 | 申请日: | 2022-06-28 |
公开(公告)号: | CN115083558A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 梁付合 | 申请(专利权)人: | 梁付合 |
主分类号: | G16H20/00 | 分类号: | G16H20/00;G16H50/30;G16H50/70;G06Q10/06;G06N3/00;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 276100 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 激励 决策 模型 运动 引导 方法 装置 电子设备 | ||
本说明书实施例提供一种激励决策模型的运动引导方法,训练健康状态预测模型,预测用户的健康状态上升空间,并确定当前阶段的健康状态上升空间,获取样本用户的动作信息和对应的健康状态变化数据,构造激励函数,利用样本用户的动作信息和对应的健康状态变化数据对激励函数进行强化学习,生成动作空间,结合强化学习出的激励函数构造动作决策模型,在动作空间中进行搜索生成动作策略,计算其激励函数值,并进行迭代,直至计算出的激励函数值满足预设条件,输出动作策略,持续更新引导用户运动并进行动作识别,通过利用激励函数值进行迭代的方式可得到全局最优的动作策略,提高了与用户的匹配度。
技术领域
本申请涉及计算机领域,尤其涉及一种激励决策模型的运动引导方法、装置和电子设备。
背景技术
随着生活水平的提高,越来越多的人开始重视身体健康,有些人通过饮食调节来保持身体健康状态,有些人通过运动的方式保持身体健康,目前,市面上出现了许多体操app,通过视频演示的方式引导用户进行动作训练,从而达到锻炼身体保持身体健康的目的。
然而,目前引导用户运动的方式,多是设置的固定的运动方案,即便对用户进行定制,也是根据设置的规则进行定制,这就导致,定制的规则实际上未必是最符合用户实际情况的,这种引导用户运动的方式的用户匹配度有待提高。
发明内容
本说明书实施例提供一种激励决策模型的运动引导方法、装置和电子设备,用以提高用户匹配度。
本说明书实施例提供一种激励决策模型的运动引导方法,包括:
训练健康状态预测模型,利用所述健康状态模型为用户预测用户的健康状态上升空间,并确定当前阶段的健康状态上升空间;
获取样本用户的动作信息和对应的健康状态变化数据,构造激励函数,利用所述样本用户的动作信息和对应的健康状态变化数据对激励函数进行强化学习,生成动作空间,结合强化学习出的激励函数构造动作决策模型;
所述动作决策模型在所述动作空间中进行搜索,根据搜索到的点生成动作策略,计算所述动作策略的激励函数值,并进行迭代,直至计算出的激励函数值满足预设条件,输出动作策略;
利用所述动作策略引导用户运动并进行动作识别,调用所述动作决策模型结合识别出的动作和所述用户当前阶段的健康状态上升空间持续更新输出动作策略实时引导用户运动。
可选地,所述动作决策模型在所述动作空间中进行搜索,根据搜索到的点生成动作策略,计算所述动作策略的激励函数值,并进行迭代,包括:
在所述动作空间中生成粒子群,以各粒子为初始点进行并发搜索,比较所述粒子群搜索到的动作策略,计算各动作策略的激励函数值并比较,得到局部最优的动作策略,进行迭代后,得到全局最优的动作策略。
可选地,所述调用所述动作决策模型结合识别出的动作和所述用户当前阶段的健康状态上升空间持续更新输出动作策略,包括:
比较引导运动的动作策略和实时识别出的动作,计算动作执行偏差,根据所述动作执行偏差调整动作决策模型,并利用调整后的动作决策模型基于所述用户当前阶段的健康状态上升空间输出动作策略。
可选地,所述第二输入项信息包括:医院体检项目信息,所述第一输入项信息包括:应用程序采集的全天运动步数信息、通过配餐冰箱采集的摄入食物信息、皮肤状态信息和体温体重信息。
可选地,所述训练健康状态预测模型,利用所述健康状态预测为用户预测用户的健康状态上升空间,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梁付合,未经梁付合许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210745680.4/2.html,转载请声明来源钻瓜专利网。