[发明专利]基于深度学习的信息分类方法及相关设备在审
| 申请号: | 202010142300.9 | 申请日: | 2020-03-04 |
| 公开(公告)号: | CN111428028A | 公开(公告)日: | 2020-07-17 |
| 发明(设计)人: | 金美芝 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F40/284 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
| 地址: | 518033 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 信息 分类 方法 相关 设备 | ||
1.一种基于深度学习的信息分类方法,其特征在于,包括:
获取待识别信息的数据数量,根据所述数据数量确定所述待识别信息的聚类方式,应用所述聚类方式对所述待识别信息进行预处理,得到预分类数据;
对所述预分类数据进行词向量转换,得到所述预分类数据的词向量;
将所述预分类数据的词向量入参到预置深度学习模型中进行文本特征提取,得到多个文本特征;
对所述各文本特征进行分类,得到文本特征的分类结果;
应用预置投票机制对所述分类结果进行打分,得到打分结果,根据所述打分结果确定所述待识别信息的分类标签。
2.根据权利要求1所述的基于深度学习的信息分类方法,其特征在于,所述获取待识别信息的数据数量,根据所述数据数量确定所述待识别信息的聚类方式,应用所述聚类方式对所述待识别信息进行预处理,得到预分类数据,包括:
将所述数据数量与预设的数据数量阈值进行比较,若所述数据数量大于所述数据数量阈值,则确定所述待识别信息为大样本数据,否则确定所述待识别信息为小样本数据;
若所述待识别信息为大样本数据,则在去除所述大样本数据中的噪声点和孤立点后应用聚类算法对所述大样本数据进行聚类,得到所述预分类数据;
若所述待识别信息为小样本数据,则应用聚类算法对所述小样本数据中的相似样本进行聚类生成多个簇,对所述各簇中的数据分别采用遗传交叉算法进行处理,得到所述预分类数据。
3.根据权利要求1所述的基于深度学习的信息分类方法,其特征在于,所述对所述预分类数据进行词向量转换,得到所述预分类数据的词向量,包括:
获取预设的词向量嵌入模型,根据所述词向量嵌入模型的属性,将所述预分类数据划分成多个句子;
将所述句子输入到所述词向量嵌入模型进行映射,得到初始文本词向量;
计算所述初始文本词向量的特征值,删除特征值为零的初始文本词向量,汇总剩余的初始文本词向量,得到所述预分类数据的词向量。
4.根据权利要求1述的基于深度学习的信息分类方法,其特征在于,所述将所述预分类数据的词向量入参到预置深度学习模型中进行文本特征提取,得到多个文本特征,包括:
将预设的标准词向量输入到预置循环神经网络模型中的输入层,通过所述循环神经网络模型中的隐层对经所述输入层处理后的词向量进行概率预测,得到概率预测结果,应用所述循环神经网络模型中的输出层对所述概率预测结果进行转换后得到预测关键词;
将所述预测关键词语与所述标准词向量对应的关键词进行比较,若一致,则将所述预分类数据的词向量入参到所述循环神经网络模型中进行特征提取,否则改变所述隐层中的参数进行重新预测直到所述预测关键词语与所述标准词向量对应的关键词一致。
5.根据权利要求1-4中任一项所述的基于深度学习的信息分类方法,其特征在于,所述对所述各文本特征进行分类,得到文本特征的分类结果,包括:
获取不同类别的分类器,根据各所述分类器之间的层级关系,建立分类器子树;
将所述文本特征输入到所述分类器子树的根节点,进行首次分类,得到首次分类结果,将所述首次分类结果输入到所述根节点的下一级叶子节点;
以所述下一级叶子节点作为新的根节点继续进行分类,直到所述下一级叶子节点为最小叶子节点;
汇总所述最小叶子节点的分类结果,得到所述文本特征的分类结果。
6.根据权利要求5所述的基于深度学习的信息分类方法,其特征在于,所述应用预置投票机制对所述分类结果进行打分,得到打分结果,根据所述打分结果确定所述待识别信息的分类标签,包括:
获取各所述最小叶子节点对应的末端分类器的分类准确率,以所述分类准确率作为所述末端分类器的权重;
以所述权重作为辅助参数,应用所述投票机制对所述末端分类器输出的分类标签进行投票打分;
提取投票分数大于分数阈值的分类标签作为所述待识别信息的分类标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010142300.9/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





