[发明专利]文本分类方法、装置及设备在审
| 申请号: | 202010434980.1 | 申请日: | 2020-05-21 |
| 公开(公告)号: | CN111753525A | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 方思维 | 申请(专利权)人: | 浙江口碑网络技术有限公司 |
| 主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F40/30;G06K9/62 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 分类 方法 装置 设备 | ||
1.一种文本分类方法,其特征在于,包括:
获取对文本语料库中文本信息进行分词处理后的文本分词;
确定文本分词对应的属性特征;
基于所述本分词对应的属性特征,选取适用于相应属性特征的统计模型对文本语料信息中文本分词进行频率统计,得到文本分词在文本信息中的权重值;
将所述文本分词在文本信息中的权重值输入至预先训练的分类器中进行分类,得到文本信息所映射的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述确定文本分词对应的属性特征,具体包括:
利用预先训练的特征语料库中所记录的分词与属性特征之间的映射关系,确定文本分词对应的属性特征;
所述利用预先训练的特征语料库中所记录的分词与属性特征之间的映射关系,确定文本分词对应的属性特征,具体包括:
将文本语料库中的文本分词与预先训练的特征语料库中所记录的分词进行特征匹配;
若匹配成功,则提取预先训练的语料库中特征匹配成功的分词所映射的属性特征,作为文本语料信息中文本分词的属性特征。
3.根据权利要求1所述的方法,其特征在于,所述基于所述本分词对应的属性特征,选取适用于相应属性特征的统计模型对文本语料信息中文本分词进行频率统计,得到文本分词在文本信息中的权重值,具体包括:
基于所述文本分词对应的属性特征,判断所述文本分词的属性特征是否涉及对象特征;
如果是,则利用融入有对象特征的统计模型对文本信息中涉及对象特征的文本分词进行频率统计,得到涉及对象特征的文本分词在文本信息中的权重值;
如果否,则利用未融入有对象特征的统计模型对文本语料信息中未涉及对象特征的文本分词进行频率统计,得到未涉及对象特征的文本分词在文本信息中的权重值。
4.根据权利要求3所述的方法,其特征在于,所述利用融入有对象特征的统计模型对文本信息中涉及对象特征的文本分词进行频率统计,得到涉及对象特征的文本分词在文本信息中的权重值,具体包括:
利用融入有对象特征的统计模型,确定涉及对象特征的文本分词在文本语料库中文本信息所涉及的统计参数;
根据所述涉及对象特征的文本分词在文本语料中文本信息对应的统计参数,计算包含对象信息的分词在文本信息中的权重值。
5.根据权利要求4所述的方法,其特征在于,所述利用融入有对象特征的统计模型,确定涉及对象特征的文本分词在文本语料库中文本信息所涉及的统计参数,具体包括:
利用融入有对象特征的统计模型,分别查询所述涉及对象特征的文本分词和未涉及对象特征的文本分词在文本信息出现的频率参数、文本语料库中文本信息所形成文本分词的数量参数;
根据所述涉及对象特征的文本分词和未涉及对象特征的文本分词在文本信息出现的频率参数、文本语料库中文本信息所形成文本分词的数量参数,确定涉及对象特征的文本分词在文本语料库中文本信息所涉及的统计参数。
6.根据权利要求4所述的方法,其特征在于,所述根据所述涉及对象特征的文本分词在文本语料中文本信息对应的统计参数,计算包含对象信息的分词在文本信息中的权重值,具体包括:
对所述涉及对象特征的文本分词在文本语料中文本信息对应的统计参数进行运算,形成涉及对象特征的文本分词对应的统计中间量;
通过汇总所述涉及对象特征的文本分词对应的统计中间量,计算包含对象信息的分词在文本信息中的权重值。
7.根据权利要求3所述的方法,其特征在于,所述利用未融入有对象特征的统计模型对文本语料信息中未涉及对象特征的文本分词进行频率统计,得到未涉及对象特征的文本分词在文本语料信息中的权重值,具体包括:
利用未融入有对象特征的统计模型,确定未涉及对象特征的文本分词在文本语料库中文本信息所涉及的统计参数;
根据所述未涉及对象特征的文本分词在文本语料库中文本信息所涉及的统计参数,计算未包含对象信息的分词在文本语料信息中的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司,未经浙江口碑网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010434980.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种盐焗澳洲坚果果仁及其制备方法
- 下一篇:电池盒组及电池盒组的制造方法





