[发明专利]注目评价对象提取装置及方法有效
申请号: | 201280013764.3 | 申请日: | 2012-05-31 |
公开(公告)号: | CN103460206B | 公开(公告)日: | 2016-10-12 |
发明(设计)人: | 樱井茂明;牧野恭子;铃木裕之 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 夏斌 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注目 评价 对象 提取 装置 方法 | ||
技术领域
本发明的实施方式涉及注目评价对象提取装置及程序。
背景技术
在计算机及网络环境中,能够收集针对特定对象的数值性的时间序列数据,并且能够取得针对特定对象的文本性的时间序列数据。在这种环境下,一直在研究如下方法:根据数值性的时间序列数据和文本性的时间序列数据,发现通过文本性的时间序列数据来说明数值性的时间序列数据的变动的模式,并且预测下一时期的应注目的评价对象。
例如,在证券市场中,一直在研究如下方法:通过将股价视为数值性的时间序列数据、将与品种相关联的新闻报导视为文本性的时间序列数据,由此发现说明股价的变动的从新闻报导中提取的模式,并且将下一时期的应注目的品种通知利用者,支援利用者的与品种交易有关的想法决定。
作为预测评价对象的方法,例如提出有两个方法。
第一个方法为以下的方式:通过明示地赋予的属性值来事先对评价对象赋予特征,生成基于与评价对象的产生有关的事件的频度的时间序列数据,并计算评价对象的重要度或者评价对象的属性值的重要度,由此在特定的问题领域中提取重要的评价对象。
另一方面,第二个方法为以下的方式:使评价对象与特定词语的出现次数的随时间变化对应,而以能够视觉地掌握评价对象与特定词语之间的关系的方式显示给利用者。
现有技术文献
专利文献
专利文献1:日本特开2002-207755号公报
专利文献2:日本特开2001-216311号公报
发明内容
发明要解决的课题
但是,以上那样的两个方法,虽然通常没有问题,但根据本发明人的研究,存在以下那样的不良情况。
例如,第一个方法为,由于通过明示的属性值来事先对评价对象赋予特征,因此存在不能够处理未事先赋予特征那样的评价对象的不良情况。此外,第一个方法还存在如下的不良情况,即与评价对象相关联的时间序列数据被限定为与评价对象的产生有关的事件的时间序列数据。
另一方面,第二个方法存在如的不良情况:即使能够视觉地掌握评价对象与特定词语之间的关系,也不能够自动地发现能够说明特定的关系产生的情况那样的模式。
本发明要解决的课题在于提供注目评价对象提取装置及程序,能够处理未事先赋予特征的评价对象,时间序列数据未被限定于与评价对象的产生有关的时间序列数据,且能够自动地发现模式。
用于解决课题的手段
实施方式的注目评价对象提取装置为如下装置,能够在根据模式从与沿时间序列赋予的多个评价对象相关联的多个文本信息中提取应注目的评价对象之前,发现上述模式。
上述注目评价对象提取装置具备文本收集单元、数值收集单元、对象表现存放单元、项目分配单元、类别判别单元、细目生成单元、模式发现单元及模式存放单元。
上述文本收集单元收集上述多个文本信息。
上述数值收集单元收集与上述各评价对象个别地相关联的数值信息。
上述对象表现存放单元将个别地表示上述各评价对象的评价对象表现与表示与该各评价对象个别地相关联的对象的关联表现建立对应而存放。
上述项目分配单元为,按上述所收集的每个文本信息,提取多个项目,并且在该各项目中存在与上述评价对象表现或上述关联表现一致的项目时,将该评价对象表现或在上述对象表现存放单元内与该关联表现建立对应的评价对象表现作为评价对象项目而分配给该文本信息。
上述类别判别单元为,根据与作为上述评价对象项目的评价对象表现所表示的评价对象相关联的上述数值信息,来判别与该数值信息的变化相关联的类别,将该类别分配给分配有该评价对象项目的文本信息。
上述细目生成单元为,按上述所收集的每个文本信息,生成包含上述所分配的评价对象项目、上述所提取的各项目及上述所分配的类别的带类别细目。
上述模式发现单元从上述细目的集合中发现表示特征性的项目的组合的上述模式。
上述模式存放单元存放上述所发现的模式。
附图说明
图1是模式地表示第一实施方式的注目评价对象提取装置的构成的框图。
图2是用于说明该实施方式的动作的流程图。
图3是表示该实施方式的数值时间序列数据的一例的模式图。
图4是表示该实施方式的文本时间序列数据的一例的模式图。
图5是表示该实施方式的项目集合的一例的模式图。
图6是表示该实施方式的评价对象知识的一例的模式图。
图7是表示该实施方式的数值时间序列数据的一例的模式图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280013764.3/2.html,转载请声明来源钻瓜专利网。