[发明专利]业务问题的分类方法及装置在审
申请号: | 201611159082.X | 申请日: | 2016-12-15 |
公开(公告)号: | CN108228622A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 韩茂琨;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 阳开亮 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 待分类文本 业务问题 分类结果 输出参数 输入分类 问题特征 信息处理领域 分类模型 分类效率 人工分类 属性表示 业务办理 业务分类 业务咨询 用户问题 自动分类 传统的 分类 输出 | ||
1.一种业务问题的分类方法,其特征在于,包括:
获取用户输入的待分类文本;
提取所述待分类文本中的第一问题特征;
生成所述待分类文本的N维特征向量,所述N维特征向量描述了所述待分类文本的N个属性,每一个属性表示一个所述第一问题特征;
将所述N维特征向量输入分类模型;
获取所述分类模型的输出参数,所述输出参数为所述待分类文本的分类结果;
其中,所述N为大于零的整数。
2.如权利要求1所述的方法,其特征在于,所述提取所述待分类文本中的第一问题特征包括:
对所述待分类文本进行预处理,以获取所述待分类文本中的有效文本;
提取所述待分类文本中所述有效文本的第一问题特征。
3.如权利要求2所述的方法,其特征在于,所述提取所述待分类文本中所述有效文本的第一问题特征包括:
对所述有效文本执行分词操作,得到多个词语;
通过词频-逆向文件频率TF-IDF算法对每个所述词语进行处理,以获取每个所述词语在所述有效文本中的重要程度的度量值;
将每一个所述度量值分别输出为一个所述待分类文本中的第一问题特征。
4.如权利要求1所述的方法,其特征在于,所述将所述N维特征向量输入分类模型之前,所述方法还包括:
基于训练文本构建并训练分类模型,包括:
获取多条已知业务类别的训练文本;
提取每条所述训练文本中的第二问题特征;
分别生成每条所述训练文本的M维特征向量,所述M维特征向量描述所述训练文本的M个属性,每一个属性表示一个所述第二问题特征;
对于所述M维特征向量中的每个所述属性,分别获取其在每一个业务类别中的出现概率;
根据所述出现概率,分别计算所述M维特征向量在每一个所述业务类别中的后验概率;
根据所述后验概率,生成朴素贝叶斯分类模型,并将所述朴素贝叶斯分类模型确定为所述分类模型。
5.如权利要求4所述的方法,其特征在于,所述根据所述出现概率,分别计算所述M维特征向量在每一个所述业务类别中的后验概率包括:
获取每一个所述业务类别的先验概率;
利用概率平滑算法对每一个所述业务类别的先验概率进行修正处理,以使所述M维特征向量中的每个所述属性,其在每一个所述业务类别中出现的概率的总和小于一;
根据所述出现概率以及处理后得到的所述每一个业务类别的先验概率,分别计算出所述M维特征向量在每一个所述业务类别中的后验概率。
6.一种业务问题的分类装置,其特征在于,包括:
获取单元,用于获取用户输入的待分类文本;
提取单元,用于提取所述待分类文本中的第一问题特征;
生成单元,用于生成所述待分类文本的N维特征向量,所述N维特征向量描述了所述待分类文本的N个属性,每一个属性表示一个所述第一问题特征;
输入单元,用于将所述N维特征向量输入分类模型;
分类单元,用于获取所述分类模型的输出参数,所述输出参数为所述待分类文本的分类结果;
其中,所述N为大于零的整数。
7.如权利要求6所述的装置,其特征在于,所述提取单元包括:
预处理子单元,用于对所述待分类文本进行预处理,以获取所述待分类文本中的有效文本;
第一提取子单元,用于提取所述待分类文本中所述有效文本的第一问题特征。
8.如权利要求7所述的装置,其特征在于,所述第一提取子单元具体用于:
对所述有效文本执行分词操作,得到多个词语;
通过词频-逆向文件频率TF-IDF算法对每个所述词语进行处理,以获取每个所述词语在所述有效文本中的重要程度的度量值;
将每一个所述度量值分别输出为一个所述待分类文本中的第一问题特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611159082.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种异地实时同步SQL数据的方法
- 下一篇:一种数据处理方法和客户端设备