[发明专利]信息处理系统、特征值说明方法和特征值说明程序在审
申请号: | 201880023104.0 | 申请日: | 2018-03-23 |
公开(公告)号: | CN110476159A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 楠村幸贵;藤卷辽平 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 11256 北京市金杜律师事务所 | 代理人: | 辛鸣<国际申请>=PCT/JP2018/ |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成函数 函数生成单元 替代 文本生成 预测目标 文本 接收单元 生成单元 表生成 应用 | ||
函数生成单元81使用预先准备的第一模板来生成特征值生成函数,该特征值生成函数从包含预测目标的变量的第一表和第二表生成可以影响预测目标的特征。特征值生成单元82向第一表和第二表应用特征值生成函数以生成特征值。说明文本生成单元83基于第二模板来生成关于特征值生成函数或特征值的说明文本。接收单元84接收要被替代到给第一和第二模板中的值。函数生成单元81将接收到的值替代到第一模板中并且生成特征值生成函数,并且说明文本生成单元83将被替代到第一模板中的该值替代到第二模板中并且生成说明文本。
技术领域
本发明涉及用于生成用于在学习或预测中使用的特征的信息处理系统,并且涉及用于描述所生成的特征的特征描述方法和特征描述程序。
背景技术
预测分析的过程大致被分为以下三个阶段。
第一阶段(步骤)是“预处理阶段”。在“预处理阶段”中,例如要被输入到根据预测分析算法操作的装置的属性(或特征)被处理,以便确保预测分析算法的有效运行。
第二阶段是“分析处理阶段”。在“分析处理阶段”中,属性例如被输入到根据预测分析算法操作的装置,以例如从根据预测分析算法操作的装置获得分析结果作为输出。
第三阶段是“后处理阶段”。在“后处理阶段”中,分析结果被转换为易于阅读的图形、要被输入到另一设备的控制信号等等。
为了从这样的预测分析获得有用的知识,有必要适当地执行“预处理阶段”。如何设计用于“预处理阶段”的程序取决于熟练掌握分析技术的人(数据科学家)的专业知识。信息处理技术尚未充分支持设计预处理阶段的任务;它仍然主要取决于技术人员的手动试错操作。
重要的是生成更多数量的属性候选以找到有用的知识。具体地,重要的是生成可能影响作为预测目标的变量(目标变量)的各种属性(说明变量)的候选,因为生成这样的各种候选可以增加候选包括有助于预测的属性的可能性。
例如,专利文献(PTL)1描述了一种属性枚举系统,其枚举作为学习数据的属性的组合的新属性。在专利文献1中被描述的系统生成一组DNF标签,每个标签表示通过对学习数据的属性和要被组合的最大属性数量的使用来组合逻辑公式表达式的方式,每个逻辑公式表达式表示属性的组合。
引用清单
专利文献
专利文献1:WO2015/186278
发明内容
技术问题
同时,在预测分析的过程中,数据分析员需要理解新生成的属性的含义。应当注意到,属性也可以被称为特征。
专利文献1公开了生成新属性,因此大量特征可以通过使用在专利文献1中被描述的系统被有效地枚举。另一方面,存在技术问题:随着所生成的特征的数量增加,掌握相应特征的含义变得更加困难。因此,优选地,可以按照数据分析员容易理解的方式提供对所生成的特征的描述,同时可以有效地生成新特征。
鉴于前述内容,本发明的目的是提供一种信息处理系统、特征描述方法和特征描述程序,其允许以人类易于理解的方式提供对所生成的特征的描述。
对问题的解决方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880023104.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据分析设备、数据分析方法和数据分析程序
- 下一篇:使用取向在地图上呈现图像