[发明专利]文本分类参数生成器和使用所生成参数的文本分类器无效
| 申请号: | 01145408.3 | 申请日: | 2001-12-28 |
| 公开(公告)号: | CN1363899A | 公开(公告)日: | 2002-08-14 |
| 发明(设计)人: | 福重贵雄;菅野祐司;饭冢泰树;玉利公一 | 申请(专利权)人: | 松下电器产业株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
| 代理公司: | 上海专利商标事务所 | 代理人: | 赵国华 |
| 地址: | 日本国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 分类 参数 生成器 使用 生成 | ||
1.一种参数集生成系统,用于确定给定文档是否属于多个预定类别中指定的一个类别,其特征在于,该系统包括:
文档集,每个文档具有识别符(ID);
包含每个文档记录的文档数据集,所述记录包含所述文档的文档ID以及在预定向量空间中表示所述文档特征的特征向量;
包含每个类别记录的类别数据集,所述记录包含所述类别的类别ID、类别名称以及所述参数集,所述参数包括在所述预定向量空间中表示所述类别特征的基准向量以及所述类别的阈值;
用于通过用文档的所述特征向量、所述基准向量以及与所述指定类别相关联的所述阈值,对每个文档计算隶属分数的装置,所述隶属分数表示文档是否属于所述指定类别;
支持操作员输入用于选择文档的各种命令参数、用于对所述选择文档评估所计算的隶属分数的装置;
根据所述命令参数其中一个命令参数的输入,向所述操作员可视地显示对于文档的所述选择有用的信息的装置;
用于显示所选择文档以及允许所述操作员评估每个显示的所选择文档的所述隶属分数,即对此设定一经过评估的隶属分数的评估装置;
用于若对于每个所述预定类别的每个文档存在所述经过评估的隶属分数便存储所述经过评估的隶属分数的装置;以及
用于通过利用所述存储装置中各个文档若有的所述经评估的隶属分数来更新所述指定类别的所述基准向量的装置,所述经计算的文档隶属分数未就所述指定类别以及所述文档数据集中包含的特征向量进行过评估。
2.如权利要求1所述的系统,其特征在于,用于计算隶属分数的所述装置包括:
用于计算每个文档的所述特征向量和所述指定类别的所述基准向量之间距离的装置;以及
用于根据所述所计算距离和所述阈值计算所述隶属分数的装置。
3.如权利要求2所述的系统,其特征在于,所述阈值由所述距离的一可能值、所述距离的标准偏差的函数、按所述距离的升序排列的所述文档集中第一次出现的文档号以及属于所述类别的文档占全部文档的比值给出,所述比值包括百分数。
4.如权利要求2所述的系统,其特征在于,用于支持操作员的所述装置包括:
用于指定预定选择准则其中一个的装置;以及
用于对所述所指定选择准则指定范围的装置。
5.如权利要求4所述的系统,其特征在于,所述用于指定一个选择准则的装置包括:用于指定所述距离其中一个距离、按所述距离顺序排列的文档列表中一位置以及所述特征向量的分量中所希望的一个分量的装置。
6.如权利要求4所述的系统,其特征在于,所述用于指定范围的装置包括:用于指定以所述阈值为中心的文档号中所希望的一个文档号、两个边界值和基于图表的规格选项的装置。
7.如权利要求5所述的系统,其特征在于,所述用于支持操作员的装置包括:用于指定本该用于所述对所述距离指定范围的行值和所述行值偏差其中一个或所述特征向量的分量中所述所希望的一个分量的装置。
8.如权利要求1所述的系统,其特征在于,所述用于支持操作员的装置包括:用于对未经评估的文档、所有文档以及经评估的文档中指定某一集合只应执行对所述选择文档的操作的装置。
9.如权利要求6所述的系统,其特征在于,所述用于可视地显示信息的装置包括:响应对所述基于图表的说明选项的选择、用于显示文档分布图表用于使操作员能够交互指定其域按所述指定的选择准则定义的所述图表范围的装置。
10.如权利要求9所述的系统,其特征在于,所述用于显示文档分布图表的装置包括:
用于对表示所述范围的指示符进行显示和定位的装置;
用于显示并输入确定所述范围的数字值的装置;以及
用于使所述指示符和数字值的位置互锁的装置。
11.如权利要求9所述的系统,其特征在于,所述用于显示文档分布图表的装置包括:用于显示其域按所述距离定义的所述文档分布图表的装置。
12.如权利要求9所述的系统,其特征在于,所述用于显示文档分布图表的装置包括:
用于显示其定义域按所述特征向量的分量其中一个分量定义的所述文档分布图表的装置;以及
用于显示指定所述其中一个分量的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01145408.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:身体治疗产品
- 下一篇:具有存储器接口的CMOS传感器阵列





