[发明专利]自主自学习系统在审
申请号: | 202080027691.8 | 申请日: | 2020-03-02 |
公开(公告)号: | CN113678146A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | A·迈尔 | 申请(专利权)人: | 弗里德里希-亚历山大埃尔朗根-纽伦堡大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06N3/00 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 凤婷 |
地址: | 德国埃*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自主 自学习 系统 | ||
1.一种借助第一智能体(S)控制技术系统的方法,其中所述第一智能体(S)实现第一人工神经网络(NN1),其中将所述第一神经网络(NN1)的第一输入向量(x)和所述第一神经网络(NN1)的当前状态(ht)共同转变为所述第一神经网络(NN1)的新状态(ht+1),且其中由所述第一神经网络(NN1)的新状态(ht+1)生成所述第一神经网络(NN1)的第一输出向量(y),
其特征在于,
-将所述第一神经网络(NN1)的第二输入向量(e)、第一输入向量(x)和当前状态(ht)共同转变为所述第一神经网络(NN1)的新状态(ht+1),其中所述第一神经网络(NN1)的第二输入向量(e)表示情绪,以及
-除了所述第一神经网络(NN1)的第一输出向量(y)之外,还由所述第一神经网络(NN1)的新状态(ht+1)生成所述第一神经网络(NN1)的第二输出向量(e'),其中所述第一神经网络(NN1)的第二输出向量(e')表示所述第一神经网络(NN1)的新状态(ht+1)的预期情绪,
使得所述第一智能体自主且自学习地适应所述技术系统的新环境。
2.根据前述权利要求所述的方法,其中为了训练所述第一神经网络(NN1),将所述第一神经网络(NN1)的第二输出向量(e')与第二参考(e*)进行对比,其中所述第一神经网络(NN1)的第二输出向量(e')与所述第二参考(e*)的对比包括距离函数、优选欧几里得距离的计算,且其中所述第二参考(e*)表示所述第一神经网络(NN1)的第二输出向量(e')的理想状态,进而表示所述第一神经网络(NN1)的新状态(ht+1)的预期情绪的理想状态。
3.根据前述权利要求所述的方法,其中
-将所述第一神经网络(NN1)的第二输出向量(e')与所述第一神经网络(NN1)的第二输入向量(e)进行对比,和/或
-由所述第一神经网络(NN1)的新状态(ht+1)和所述第一神经网络(NN1)的第一输出向量(y)生成所述第一神经网络(NN1)的第二输出向量(e')。
4.根据前述权利要求中任一项所述的方法,其中为了训练所述第一神经网络(NN1),将所述第一神经网络(NN1)的第一输出向量(y)与第一参考(y*)进行对比,其中所述第一神经网络(NN1)的第一输出向量(y)与所述第一参考(y*)的对比包括距离函数、优选欧几里得距离的计算,且其中所述第一参考(y*)表示所述第一神经网络(NN1)的第一输出向量(y)的理想状态。
5.根据权利要求1至3中任一项所述的方法,其中
-将所述第一神经网络(NN1)的第一输出向量(y)馈送至第二人工神经网络(NN2)作为所述第二神经网络(NN2)的第一输入向量(y),其中由第二智能体(W)来实现所述第二神经网络(NN2),
-将所述第二神经网络(NN2)的第一输入向量(y)和所述第二神经网络(NN2)的当前状态(wt)共同转变为所述第二神经网络(NN2)的新状态(wt+1),
-由所述第二神经网络(NN2)的新状态(wt+1)生成所述第二神经网络(NN2)的第一输出向量(x'),其中所述第二神经网络(NN2)的第一输出向量(x')表示所述第二神经网络(NN2)对所述第二神经网络(NN2)的第一输入向量(y)的预期反应,以及
-将所述第二神经网络(NN2)的第一输出向量(x')与所述第一神经网络(NN)的第一输入向量(x)进行对比,以便训练所述第一神经网络(NN1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗里德里希-亚历山大埃尔朗根-纽伦堡大学,未经弗里德里希-亚历山大埃尔朗根-纽伦堡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080027691.8/1.html,转载请声明来源钻瓜专利网。