[发明专利]一种基于深度学习的医疗对话系统意图识别分类方法在审
申请号: | 202011201009.0 | 申请日: | 2020-11-02 |
公开(公告)号: | CN112364139A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 侯慧 | 申请(专利权)人: | 南京京恒信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G16H50/20;G16H80/00 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 王华 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 医疗 对话 系统 意图 识别 分类 方法 | ||
1.一种基于深度学习的医疗对话系统意图识别分类方法,其特征在于:包括以下步骤
步骤1:收集样本,分拣样本的意图输入信息和意图输出信息,将意图输入信息分割并进行数量化获得具有N个特征向量的特征向量集,每个意图输入信息根据特征向量集进行数量化,意图输出信息进行数量化,并在意图输入信息与意图输出信息之间建立单一性映射;
步骤2:获得客户文本,将客户文本分解成M个特征向量,并将M个特征向量对照特征向量集,将客户文本根据特征向量集进行数量化,并且提取样本中所有包含M个特征向量的意图输入信息样本;
步骤3:将步骤2中获得的所有包含M个特征向量的意图输入信息样本进行聚集获取其交集,从交集中获取第M+1个特征向量;
步骤4:将客户文本扩充成M+1个特征向量,并M+1个特征向量与样本中的意图输入信息的N个特征向量对比,提取样本中所有包含M+1个特征向量的意图输入信息样本;
步骤5:将将步骤4中获得的所有包含M+1个特征向量的意图输入信息样本进行聚集获取其交集,从交集中获取第M+2个特征向量;
步骤6:直至扩展到获得第N+k个特征向量(第N+K+1个特征向量为零),根据单一性映射,获得对应的意图输出结果。
2.根据权利要求1所述的基于深度学习的医疗对话系统意图识别分类方法,其特征在于:所述意图输入信息进行数量化后的N个特征向量,对其赋予权重。
3.根据权利要求2所述的基于深度学习的医疗对话系统意图识别分类方法,其特征在于:所述步骤3中,按照权重高低顺序排列获得第N+1个向量。
4.根据权利要求1所述的基于深度学习的医疗对话系统意图识别分类方法,其特征在于:所述样本集的N特征向量是每个样本的特征向量的并集。
5.根据权利要求1所述的基于深度学习的医疗对话系统意图识别分类方法,其特征在于:所述意图输入信息的矩阵定义为Ri=[ri1,ri2,ri3,ri4…riN],i=1,2…P,其中P代表样本量,rij代表特征向量;与Ri对应的意图输出信息,其对应的单一性映射为Ci=[“输出信息”],即映射函数F(Ri)=Ci=[“输出信息i”]。
6.根据权利要求5所述的基于深度学习的医疗对话系统意图识别分类方法,其特征在于:对特征向量ri1,ri2,ri3,ri4…riN赋予权重,依序为[ai1,ai2,ai3,ai4…aiN]。
7.根据权利要求1所述的基于深度学习的医疗对话系统意图识别分类方法,其特征在于:步骤3中的聚集,若客户文本含有M个特征向量,则将样本中所有包含M个特征向量不为零的意图输入信息Ri集合起来;求解出第M+1个向量,第M+1个向量为除去M个特征向量后,集合起来的样本中交集最多的特征向量,此特征向量不为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京京恒信息技术有限公司,未经南京京恒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011201009.0/1.html,转载请声明来源钻瓜专利网。