[发明专利]一种类别从属度计算方法及系统在审
申请号: | 201410114574.1 | 申请日: | 2014-03-25 |
公开(公告)号: | CN104951638A | 公开(公告)日: | 2015-09-30 |
发明(设计)人: | 叶茂;雷超;徐剑波;王元龙;汤帜 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 寇海侠 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类别 从属 计算方法 系统 | ||
技术领域
本发明涉及电子数字处理领域,具体地说是一种衡量某个数据属于某个分类的程度的类别从属度计算方法。
背景技术
当今社会中数据信息日益庞大,为了在海量的数据中,更好的获取所需的数据,需要对数据进行分类。数据分类是根据一定的规则将某个数据划分到某个分类中。如有监督的数据分类方法,依靠小样本学习后得到的模型,对其他更大范围的未分类数据进行分类。根据一定的规则,将某一个数据最终划到一个类别中。
但是,在进行分类时,用户不仅会关注一个数据被分到了某个分类,除了这个分类信息之外,在所关注的分类中,用户可能还需要知道数据属于分类的程度,即类别从属度。目前的分类技术,例如liblinear SVM分类技术,可以提供分类信息,但不能提供类别从属度信息。例如,一本书籍介绍餐饮娱乐信息,分类体系中有餐饮、娱乐、军事、政治等分类,基于该分类体系,该书籍可能会被分到餐饮或娱乐中的一个类别。假设该书籍被分到了餐饮类,则用户最终可以获取该书籍属于餐饮类这一个信息,但是,对于用户而言,可能还需要了解,针对餐饮和娱乐这两个他所关注的分类,该书籍属于餐饮类的程度或属于娱乐类的程度这一信息。此外,针对某个分类下的数据,如果能更好的提供其属于其他分类的程度,也会为用户提供更多的参考信息,让用户获得数据时具有更好的参考信息。例如,对于被分到餐饮类的书籍,用户可能还想获知其属于历史还是属于娱乐的程度大,如果能够提供该餐饮类下的书籍,属于其他类的程度,也会为用户提供更多的参考信息。
发明内容
为此,本发明所要解决的技术问题在于现有技术中仅提供对数据的分类,不能提供数据属于分类的程度、不能为用户提供更多的参考信息,从而提出一种为用户提供更多的参考信息的类别从属度的计算方法。
为解决上述技术问题,本发明提供一种类别从属度的计算方法,包括如下步骤:
确定所有分类;
确定参考分类,其中,所述参考分类为所有分类中的部分或全部;
确定待分析数据对应所述参考分类中每个分类的参考值;
对于每个分类,根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值,确定待分析数据对于该分类的类别从属度。
一种类别从属度的计算系统,包括:
所有分类确定模块:确定所有分类;
参考分类确定模块:确定参考分类,其中,所述参考分类为所有分类中的部分或全部;
参考值计算模块:确定待分析数据对应所述参考分类中每个分类的参考值;
类别从属度计算模块:对于每个分类,根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值,确定待分析数据对于该分类的类别从属度。
本发明的上述技术方案相比现有技术具有以下优点,
(1)本发明所述的类别从属度的计算方法,首先确定所有分类以及参考分类,然后确定待分析数据对应所述参考分类中每个分类的参考值,再根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值确定待分析数据对于该分类的类别从属度。该方案中,通过选择适当的参考值,来表示待分析数据对应每个分类的关系大小,然后再通过待分析数据在该分类的参考值和对每个分类的参考值的关系,最终确定该待分析数据对于该分类的类别从属度,通过这种方法来计算类别从属度,可以很好的表示出待分析数据与其关注的那些分类之间的从属关系的大小,从而通过类别从属度表示出待分析数据与参考分类中每个分类的从属度数据,使用户一目了然的知道了待分析数据与其关注的分类的关系,为用户提供更多的分类参考信息,不仅计算简单,而且非常直观。
(2)本发明还提供可实现上述功能的类别从属度的计算系统,包括所有分类确定模块、参考分类确定模块、参考值计算模块、类别从属度计算模块,实现了类别从属度的计算,提供一种基于分类的类别从属度信息,将类别从属信息进行了量化,使得用户可以直观的获取类别从属程度,为用户提供更多的分类的参考信息。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明类别从属度的计算方法一个实施例的流程图;
图2是本发明类别从属度的计算系统的一个实施例的结构框图。
具体实施方式
实施例1:
本实施例提供一种类别从属度的计算方法,流程图如图1所示,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410114574.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用