[发明专利]一种基于证据森林的信息不确定条件目标意图识别方法在审
申请号: | 202110605856.1 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113177615A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 蒋雯;李新宇;邓鑫洋;张瑜 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 证据 森林 信息 不确定 条件 目标 意图 识别 方法 | ||
1.一种基于证据森林的信息不确定条件目标意图识别方法,其特征在于,包括以下步骤:
步骤一、数据预处理:
步骤101:输入n个目标训练样本,包括属性特征向量X=[X1,X2,…,Xv],其中v为属性个数,Xi,i=1,2,…,v表示每个属性特征的测量值,对应每个样本的意图Y,Y的辨识框架为ΘY={Y1,Y2,…,Yw},w表示辨识框架中意图的个数;
步骤102:对每个属性特征建立高斯模糊数f[C:(μ,δ)],μ和δ表示高斯模糊数C的均值和方差,辨识框架k表示每个属性辨识框架中的类别个数,计算每个属性特征测量值Xi的高斯模糊隶属度值f(Xi),根据公式计算单子集m'(Fj)和双子集m'(Fj,Fj+1),归一化得到属性的基本概率分布最终将n个样本属性测量值(X1,X2,…,Xv)n转化为基本概率分布的形式
步骤103:根据公式将转化为概率分布转化n个样本的全部属性特征得到
步骤104:将意图取值为Yp的样本的不同属性中包含的P(Fj)进行乘积组合辨识框架元素组合为组合后的意图可以表示为将所有样本组合后,属性辨识框架元素组合相同的样本的进行相加和合并得到将归一化得到
步骤105:根据公式构造意图标签的多子集信度,z表示(Y1,Y2,…,Yw1)中的意图个数,上述生成的多子集与单子集[P'(Y1),P'(Y2),…,P'(Yw)]组成[P'(Y1),P'(Y2),…,P'(Y1,Y2,…,Yw)],归一化得到意图的基本概率分布mY=[m(Y1),m(Y2),…,m(Y1,Y2,…,Yw)];
步骤106:属性特征辨识框架元素组合和意图的概率分布mY=[m(Y1),m(Y2),…,m(Y1,Y2,…,Yw)]构成n1个训练模型的数据,n1n;
步骤二、构建信度决策树:
步骤201:根据公式计算每条训练样本的意图的概率分布,这里|Y|表示Y中包含的元素个数;
步骤202:根据公式计算所有训练样本的意图的平均信度,再根据公式计算意图平均信度的信息熵;
步骤203:根据公式计算属性特征的信息熵,其中表示属性Xi在Fj下的样本个数;
步骤204:计算属性Xi取值到模糊类别Fj下每条样本的意图基本概率分布[m(Y1),m(Y2),…,m(Y1,Y2,…,Yw)]对[m(Y1)=1],[m(Y2)=1],…,[m(Yw)=1]的证据距离(d1,d2,…,dw),所述的证据距离计算公式为和表示两个基本概率分布m1和m2构成的向量,为2N×2N的矩阵,的行标对应m1,列标对应m2,中每个元素为A和B分别为m1和m2中的焦元,计算相似度[(1-d1),(1-d2),…,(1-dw)],计算属性Xi取值到模糊类别Fj下所有样本相似度的均值和方差[(μ1,δ1),(μ2,δ2),…,(μw,δw)];
步骤205:根据公式计算方差加权后的均值,归一化得到(U1,U2,…,Uw),根据公式计算属性Xi对意图的信息熵;
步骤206:根据公式计算第i个属性的信息增益比,计算所有v个属性的信息增益比,选择信息增益比最大的属性作为信度决策树的分裂属性;
步骤207:每次选择完一个分裂属性,重复步骤201-206,直到满足该节点只剩下一个训练样本或者多个同类别的样本,该节点作为叶子节点将存放这些样本的意图的基本概率分布;
步骤三、构建基于信度决策树的证据森林:
步骤301:采用重复采样技术,训练证据森林的每棵树都为不同的训练样本,避免过拟合;
步骤302:对于步骤301得到的训练样本,从个数为v的属性中,随机无放回的选择m1个属性,作为训练信度决策树的训练样本;
步骤303:设定证据森林中信度决策树的个数N,根据步骤二建立多棵信度决策树构成证据森林;
步骤304:计算证据森林中每棵树的权重,每棵信度决策树可以得到训练样本的识别结果ms(l)=[ms'(Y1),ms'(Y2),…,ms'(Y1,Y2,…,Yw)]l,l=1,2,…,N,计算每棵树的识别结果ms(l)和样本真实意图[m(Y1),m(Y2),…,m(Y1,Y2,…,Yw)]的证据距离(D1,D2,…,DN),计算相似度[(1-D1),(1-D2),…,(1-DN)],计算每棵树对所有样本的平均相似度
步骤305:根据公式归一化平均相似度,根据公式计算可能性测度,根据公式计算相必要性测度,A1∈[1,2,…,(1,2),(1,3),…,(1,2,…,N)]表示信度决策树的集合;
步骤306:求解每棵信度决策数的权重Wl,根据步骤305得出的可能性测度和必要性测度,得出权重约束条件q(A2)≤[W(o1)+W(o2)+…+W(oN)]≤p(A2),W(o1)+W(o2)+…+W(oN)=1,其中A2=[(o1),(o2),…,(oN)],融合所有树的识别结果根据步骤201中的公式计算Ms中意图的概率分布BetP[Ms(j)],根据公式计算Ms的信息熵,求解满足约束条件下使得Info(Ms)最小的最优权重(W1,W2,…WN)min[Info(Ms)]作为每棵树的权重;
步骤四、使用构建的证据森林进行意图识别:
步骤401:将待测的原始样本经过步骤102处理,得到处理后的样本其中每个属性为基本概率分布;
步骤402:将属性的辨识框架拓展为将待测样本通过辨识框架拓展为个联合焦元分布联合焦元的基本概率分布值每个联合焦元在生成的信度决策树下遍历得到对应叶子节点的意图的概率分布mY=[m(Y1),m(Y2),…,m(Y1,Y2,…,Yw)],令|mY|表示该叶子节点下意图概率分布的个数;
步骤403:根据公式Bel[mT](Yp)=∑Bel[mχY](Yp)*m(χ),χ∈ΘF,计算待测样本mT关于意图Yp的置信函数值,即每个联合焦元在信度决策树所对应的叶子节点中mχY对意图Yp的置信函数值Bel[mχY](Yp)与每个联合焦元的基本概率分布值m(χ)的乘积再多个联合焦元求和,得到待测样本mT对意图Yp的置信函数值,若一个联合焦元在信度决策树中对应多个叶子节点,多个叶子节点对Yp的置信函数值Bel[mχY](Yp)=Bel{m[χ1]Y}(Yp)∨Bel{m[χ2]Y}(Yp),其中∨表示公式所述的置信函数计算公式为
步骤404:根据步骤403得到待测样本mT关于意图的置信函数Bel[mT](Yp),Yp∈[Y1,Y2,…,(Y1,Y2),…,(Y1,Y2,…,Yw)],根据公式将置信函数转化为基本概率分布t(Y)l=[m(Y1),m(Y2),…,m(Y1,Y2,…,Yw)],l=1,2,…,N,根据公式将每棵树的识别结果进行融合;
步骤405:根据公式将融合结果进行N-1次自组合,其中表示证据组合公式其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110605856.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动补料型海水淡化水矿化塔
- 下一篇:一种铅锌钒精矿湿法分离工艺及其设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置