[发明专利]媒体信息张量监督学习方法在审
申请号: | 201710598035.3 | 申请日: | 2017-07-20 |
公开(公告)号: | CN107506848A | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 李庆;蒋李灵 | 申请(专利权)人: | 西南财经大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06Q40/04;G06F17/18 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 611130 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 信息 张量 监督 学习方法 | ||
技术领域
本发明涉及一种监督学习方法,尤其涉及一种媒体信息张量监督学习方法。
背景技术
随着信息技术的发展,互联网媒体逐渐成为主流的媒体形式。特别是以博客、微博、社会化新闻、维基百科和网络论坛为主的社会化媒体的兴起,其媒体影响力日益加剧。海量信息和裂变式传播使互联网媒体对股票市场产生了举足轻重的影响。
当结合不同纬度信息预测股票价格波动时,现有技术是将不同维度的信息特征值拼接为一个超级特征向量,然后运用基于向量预测模型去探测互联网媒体信息对股市的影响。但是,由于不同维度的信息是交互影响,并且紧密相关、互为补充,将不同维度的信息之间的关联隔断后直接拼接成一为一个超级特征向量,这样容易出现维度灾难。维度灾难,即在机器学习算法中输入的属性向量长度过长,导致算法性能不再随信息量的增多而提高,反而使算法效果降低。并且在拼接超级特征向量的时候,认为不同维度的信息特征是相互独立的,减弱了不同维度信息特征间的相互作用,甚至是忽略了他们之间的联系。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用张量来表示媒体信息空间,从而可以将不同维度的信息和之间的相互关系纪录下来的方式,并基于媒体信息张量利用监督学习算法来捕捉互联网媒体与股票市场的波动关系,对股票市场进行预测。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明实施例提供一种媒体信息张量监督学习方法,具体包括:
S1、收集媒体信息;
可选地,所述媒体信息包括市场交易信息、媒体新闻信息、股民情感信息;市场交易信息来自于公司的基本数据,如股票的交易价格、公司的规模、交易数量等信息,能从数据的角度反应公司目前的运作情况。新闻媒体信息来自于日常股票新闻,包含了公司基本情况的内容,能让投资者获取丰富的信息,全面了解公司的情况,包含消极或者积极的内容,容易影响投资者非理性投资。股民情感信息来自于股票论坛等社交媒体,通过社交媒体中的情感词来捕捉社会情绪。
S2、构建n阶媒体信息张量x;
S3、构建n阶张量监督学习算法的超平面函数f(χ)=χ×1a1×2a2...×nan+b;
S4、基于媒体信息训练样本集求解超平面函数中的参数ak、b,其中k=1、2、…n;
具体地,训练样本集为{{x1,y1},{x2,y2},...,{xN,yN}},张量数组{x1,x2,...,xN}为媒体信息训练样本集;训练样本集对应的目标值为{y1,y2,...,yN},N为样本数。
可选地,求解ak、b,其中k=1、2、...n的步骤为:
S41、设置m=0;
S42、m=m+1;
S43、令βk,k≠m=||ak||2,
S44、通过计算am;
其中,为目标函数,为约束条件;C为惩罚因子,ε为误差,ξ为松弛变量;
S45、判断问题是否收敛,若是则执行步骤S46,若不是,则执行步骤S42;
S46、输出:ak、b,其中k=1、2、...n,惩罚因子C,误差ε。
S5、基于计算的超平面函数f(χ)=χ×1a1×2a2...×nan+b对股票波动进行预测。
下面通过实施例对二阶张量的监督学习算法进行具体说明:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南财经大学,未经西南财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710598035.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置