[发明专利]一种义原的分类方法及装置在审
| 申请号: | 201510137243.4 | 申请日: | 2015-03-26 |
| 公开(公告)号: | CN104699819A | 公开(公告)日: | 2015-06-10 |
| 发明(设计)人: | 张连超;刘宇;张鹏 | 申请(专利权)人: | 浪潮集团有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 分类 方法 装置 | ||
1.一种义原的分类方法,其特征在于,包括:预先设置多个义原的类别,每个类别对应多个原始义原,预先设置语料库,还包括:
S1:获取待分类的义原;
S2:获取每个待分类的义原在所述语料库中所在的语境,及每个原始义原在所述语料库中所在的语境;
S3:计算每个待分类的义原在每个对应的语境下出现的第一条件概率,及每个原始义原在每个对应的语境下出现的第二条件概率;
S4:将每个待分类的义原的每个第一条件概率分别与每个原始义原的每个第二条件概率进行比较,当当前待分类的义原有任一第一条件概率与当前原始义原的任一第二条件概率的差值小于等于第一预设值时,判定当前待分类的义原与当前原始义原属于同一个类别。
2.根据权利要求1所述的方法,其特征在于,所述S2中,所述获取每个待分类的义原在所述语料库中所在的语境,包括:
A1:获取待分类的义原在所述语料库中的位置;
A2:分别获取当前待分类的义原的当前位置的前面第二预设值个前方义原,及当前待分类的义原的当前位置的后面第二预设值个后方义原;
A3:将获取的第二预设值个前方义原和第二预设值个后方义原作为当前待分类的义原在所述语料库中所在的语境;
所述S2中,所述获取每个原始义原在所述语料库中所在的语境,包括:
B1:获取原始义原在所述语料库中的位置;
B2:分别获取当前原始义原的当前位置的前面第二预设值个前方义原,及当前原始义原的当前位置的后面第二预设值个后方义原;
B3:将获取的第二预设值个前方义原和第二预设值个后方义原作为当前原始义原在所述语料库中所在的语境;
其中,所述第二预设值的取值范围是[1,5],所述第二预设值为整数。
3.根据权利要求1-2任一所述的方法,其特征在于,所述S3中,所述计算每个待分类的义原在每个对应的语境下出现的第一条件概率,包括:
根据公式一计算当前待分类的义原在当前对应的语境下出现的第一条件概率,其中,公式一为:
P1(Wi1|Context1)为所述第一条件概率,Wi为当前待分类的义原,Context为当前待分类的义原的当前对应的语境,Counti1是当前待分类的义原在当前对应的语境中出现的次数,Vcontext1i为当前待分类的义原的当前对应的语境中的第i个义原的词向量;
所述S3中,所述计算每个原始义原在每个对应的语境下出现的第二条件概率,包括:
根据公式二计算当前原始义原在当前对应的语境下出现的第二条件概率,其中,公式二为:
P2(Wi2|Context2)为所述第二条件概率,Wi为当前原始义原,Context为当前原始义原的当前对应的语境,Counti2是当前原始义原在当前对应的语境中出现的次数,Vcontext2j为当前原始义原的当前对应的语境中的第j个义原的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司;,未经浪潮集团有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510137243.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地图点要素注记自动配置方法
- 下一篇:一种数据处理方法及装置





