[发明专利]基于机器学习知识的分类方法在审
申请号: | 201711463481.X | 申请日: | 2017-12-28 |
公开(公告)号: | CN110110076A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 冉露;吴晟昊;吕宏轮;刘旭;赵瑞娜;余黎阳 | 申请(专利权)人: | 重庆南华中天信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李琦 |
地址: | 400039 重庆市九龙坡*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 基于机器 知识内容 分词 知识管理平台 检索准确率 标签分类 分类结果 过滤信息 邻居集合 推理规则 信息推荐 用户分类 预设频率 预设位置 知识检索 最优组合 词组 精准度 综合分析 推导 加权 搜寻 采集 筛选 输出 学习 | ||
1.一种基于机器学习知识的分类方法,其特征在于,所述方法包括:
采集用户的分类行为推导分类推理规则;
获取待分类的知识;
采用分词法提取所述知识内容中的关键字词,其中,所述关键字词包含关键字与词组;
计算所述关键字词出现的频率与位置;
筛选满足预设频率与预设位置的关键字词,输出所述关键字词作为分类结果。
2.根据权利要求1所述的基于机器学习知识的分类方法,其特征在于,所述采集用户的分类行为推导分类推理规则的步骤,包括:
在知识管理平台采集大量用户知识分类行为数据;
提取所述数据中知识的关键字词;计算所述关键字词出现频率确定其与分类行为关系;
根据所述数据中各类知识的关键字词与分类行为关系的权重,构建加权因子、变换、混合规则,得到知识分类推理规则。
3.根据权利要求1所述的基于机器学习知识的分类方法,其特征在于,所述采用分词法提取所述知识内容中的关键字词,其中,所述关键字词包含关键字与词组的步骤,包括:
采用分词法提取知识内容中的关键字词,在知识管理平台中搜寻该用户分类行为;
根据所述用户的分类行为建立最近邻居集合,结合关键字词加权、变换、混合、特征、元级别进行综合分析,得到最优组合的关键字词。
4.根据权利要求1所述的基于机器学习知识的分类方法,其特征在于,所述计算所述关键字词出现的频率与位置的步骤,包括:
滤除所述关键字词中非法字符、语气词与停用词;针对知识所对应的主体进行分词与词性标注,定位所述主体内关键字词的位置,统计所述关键字词出现的频率。
5.根据权利要求1所述的基于机器学习知识的分类方法,其特征在于,所述筛选满足预设频率与预设位置的关键字词,输出所述关键字词作为分类结果的步骤,包括:
检测所述关键字词出现的频率次数与在所述主体内位置是否满足在预设频率次数和预设的主体位置范围;
当所述关键字词出现频率次数在预设频率次数范围内且所述关键字词所在主体的位置符合预设的主体位置范围内时,则将所述关键字词作为分类结果;
当所述关键字词出现频率次数不在预设频率范围内,或,当所述关键字词所在主体的位置不符合预设的主体位置范围内时,则无法将所述关键字词作为分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆南华中天信息技术有限公司,未经重庆南华中天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711463481.X/1.html,转载请声明来源钻瓜专利网。