[发明专利]一种结合马尔科夫决策过程的动作知识提取方法在审
申请号: | 201710173631.7 | 申请日: | 2017-03-22 |
公开(公告)号: | CN106997488A | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 吕强;李兆荣;李欢 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06K9/62 |
代理公司: | 南京理工大学专利中心32203 | 代理人: | 唐代盛 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 马尔科夫 决策 过程 动作 知识 提取 方法 | ||
1.一种结合马尔科夫决策过程的动作知识提取方法,其特征在于,包括如下步骤:
步骤1:训练随机森林模型H;
步骤2:定义动作知识提取问题AKE:针对随机森林模型H,对属性进行分割,定义属性变化、动作,在此基础上定义动作知识提取问题AKE;
步骤3、用马尔科夫决策过程求解AKE优化问题:对任意输入数据,定义马尔科夫决策过程MDP,并定义策略,通过策略迭代更新策略,最后求解得到一个最优策略。
2.如权利要求1所述的一种结合马尔科夫决策过程的动作知识提取方法,其特征在于,步骤1中的训练随机森林模型H具体为:
给定一个训练数据集,建立一个随机森林模型H;定义训练数据集为{X,Y},X为输入数据向量集合,Y为输出类别标记集合,通过随机采样和完全分裂建立随机森林模型H,随机森林模型H的预测函数为
其中,为输入向量,y∈Y,y为随机森林模型H在输入向量为的情况下输出的预测分类,c为期望分类目标,d为第d棵决策树,D为随机森林中决策树的总棵数,wd为第d棵决策树的权重,为第d棵决策树在输入的情况下对应的输出,为指示函数,表示在输入数据向量为的情况下输出的预测分类为c的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710173631.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动力电池点焊设备
- 下一篇:一种镭射焊接手机排线支架的治具