[发明专利]文献分类装置有效
申请号: | 201780097136.0 | 申请日: | 2017-11-22 |
公开(公告)号: | CN111373392B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 山口真主;安藤俊幸;长原进介 | 申请(专利权)人: | 花王株式会社 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q50/18 |
代理公司: | 北京尚诚知识产权代理有限公司 11322 | 代理人: | 龙淳;徐飞跃 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文献 分类 装置 | ||
本发明的文献分类装置(10)包括:获取对于各文献预先被分别赋予了基于多观点分类的分类代码的被分类文献集合的信息的单元(22);对于被分类文献集合的各文献分别生成以对被分类文献集合赋予的所有类型或者一部分类型的该分类代码为各元素的多维的特征量向量的单元(23),使用各文献的特征量向量,将被分类文献集合分类的分类单元(24);和生成表示分类的结果的文献分类信息的生成单元(25)。
技术领域
本发明涉及将文献分类的技术。
背景技术
关于专利申请授权公告、注册实用新型公告、专利申请公开公告、日本申请的国际申请公开公告这些专利或者实用新型涉及的文献(以下总称为专利文献),标注了国际专利分类(IPC)、FI记号、F词条这些分类代码。此外,对于日本特许厅运用的计算机软件数据库(CSDB)中积累的各种文献标注了称为CS词条的分类代码,也有社内技术报告等的在各公司标注独自的分类代码来进行管理的文献。
存在利用对这样的文献标注的分类代码来检索文献的各种方法。
在下述专利文献1中,为了研究者或开发者容易地进行专利文献等的工业产权相关的文献的检索,而公开了一种辅助方法。在该方法中,从将使用者输入的公告号作为检索关键字的检索结果中提取主题代码和F词条进行提示,由此使得使用F词条的检索容易化。
在下述专利文献2中,公开了通过活用分类代码进行统计处理,能够在短时间内简便地分析大量的专利文献所属的技术领域的方法。该方法提取对各个专利文献所赋予的多个分类代码,从所提取的分类代码的集合选出数值分析用分类代码,通过数值分析计算出数值分析用分类代码的坐标,基于数值分析用分类代码的坐标计算出各个专利文献的坐标,基于专利文献的坐标制作表现其密度的规定的映射。
在下述非专利文献1中,公开了制作将对各专利文献的F词条(F-term)的赋予容易性进行数值化而得的F词条概念向量或者加权F词条概念向量,计算出专利文献间的相似度,由此提高专利检索精度的方法。该方法中,使用将专利文献作为学习数据、并将文献中出现的语素uni-gram用于特征来学习的每一个F词条的SVM分类器,使用从该SVM分类器的输出值来生成F词条概念向量。
现有技术文献
专利文献1:日本特开2014-2563号公报。
专利文献2:日本特开2015-207173号公报。
非专利文献
非专利文献1:目黑光司(其他5人),“使用了F词条概念向量的专利检索系统的改良”,语言处理学会第21回年次大会发表论文集,768页-771页,2015年3月。
发明内容
本发明涉及一种文献分类装置,其包括:文献集合获取单元,其获取被分类文献集合的信息,上述被分类文献集合中对各文献预先分别赋予了基于多观点分类的分类代码;向量生成单元,其对上述被分类文献集合的各文献分别生成多维的特征量向量,上述多维的特征量向量以对上述被分类文献集合赋予的所有类型或者一部分类型的上述分类代码为各元素;分类单元,其使用上述各文献的特征量向量,将上述被分类文献集合分类;和生成单元,其生成表示上述分类的结果的文献分类信息。
附图说明
图1是概念性地表示各实施方式的文献分类装置的硬件结构例的图。
图2是概念性地表示第一实施方式的文献分类装置的控制结构的模块图。
图3是表示特征量向量的第一生成图像的概念图。
图4是表示特征量向量的第二生成图像的概念图。
图5是表示特征量向量的第三生成图像的概念图。
图6是表示第一实施方式的文献分类装置的动作例的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于花王株式会社,未经花王株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780097136.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子元件安装方向确认系统及电子元件安装方向确认方法
- 下一篇:元件安装用吸嘴