[发明专利]一种基于金融社交网络估算合理薪酬的方法在审

专利信息
申请号: 201911047906.8 申请日: 2019-10-30
公开(公告)号: CN110826892A 公开(公告)日: 2020-02-21
发明(设计)人: 饶东宁;林卓毅 申请(专利权)人: 广东工业大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q10/10;G06Q40/02
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 张金福
地址: 510006 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 金融 社交 网络 估算 合理 薪酬 方法
【权利要求书】:

1.一种基于金融社交网络估算合理薪酬的方法,其特征在于,包括以下步骤:

S1:数据收集:收集BoardEx数据、同一时期各公司的市场价值和当地的平均薪酬水平savg

S2:数据预处理:从BoardEx数据中获取金融社交网络,以及人员薪酬sp

S3:网络中心性计算:计算各人员在金融社交网络中的多种网络中心性;

S4:薪酬指数计算:薪酬指数为当前薪酬与当地平均薪酬之比,薪酬指数作为回归模型的标签因变量;

S5:建立回归模型,以各人员的网络中心性和公司的市场价值作为特征,薪酬指数作为标签因变量,训练得出包括权重和编置的最终模型;

S6:用训练好的最终模型计算人员的合理薪酬指数,从而得出合理薪酬。

2.根据权利要求1所述的基于金融社交网络估算合理薪酬的方法,其特征在于,所述步骤S1中收集BoardEx数据包括人员商业联系、所在公司及所任职务和个人信息。

3.根据权利要求2所述的基于金融社交网络估算合理薪酬的方法,其特征在于,步骤S2中从人员商业联系获取金融社交网络,从个人信息获取人员薪酬sp,把公司市值及当地平均薪酬水平对应至各人员所在公司。

4.根据权利要求3所述的基于金融社交网络估算合理薪酬的方法,其特征在于,步骤S3中的网络中心性包括度中心性、接近中心性、压力中心性、介数中心性、路径中心性、PageRank、三角计数、特征向量中心性、k值不同的k-压力中心性、k-路径中心性、k-介数中心性。

5.根据权利要求4所述的基于金融社交网络估算合理薪酬的方法,其特征在于,步骤S3中利用Spark平台的Pregel方法,并行计算各人员在金融社交网络中的各种网络中心性。

6.根据权利要求5所述的基于金融社交网络估算合理薪酬的方法,其特征在于,度中心性计算公式如下:

CD(i)=∑jx(i,j)

其中,CD(i)表示金融社交网络中顶点i的度中心性,x(i,j)表示顶点i和顶点j(i≠j)的连接关系,如有连接为1,否则为0。

7.根据权利要求5所述的基于金融社交网络估算合理薪酬的方法,其特征在于,金融社交网络为连通图时,接近中心性计算公式如下:

其中,CC(i)表示金融社交网络顶点i的接近中心度,d(j,i)表示表示顶点j到顶点i(i≠j)的最短距离;

金融社交网络为非连通图时,加入调和系数,接近中心性成为调和接近中心性,计算公式如下:

其中C′C(i)表示顶点i的调和接近中心性,n是顶点i所在的连通子图的顶点数,N表示金融社交网络的顶点数量。

8.根据权利要求5所述的基于金融社交网络估算合理薪酬的方法,其特征在于,介数中心性计算公式如下:

其中,CB(i)表示金融社交网络中顶点i的介数中心性,σst表示顶点s到顶点t的最短路径数,σst(i)表示顶点s到顶点t经过顶点i的最短路径数,为了比较不同规模的网络中顶点的介数中心性,会对该度量进行缩放,在金融社交网络为有向图时:

金融社交网络为无向图时:

C′B(i)缩放后介数中心性,N是顶点数。

9.根据权利要求5所述的基于金融社交网络估算合理薪酬的方法,其特征在于,PageRank计算公式如下:

其中,PR(i)表示金融社交网络中顶点i的PageRank值,d是阻尼系数,N是顶点总数,j是指向顶点i的顶点,在无向图中为顶点i的邻居顶点,CD(j)表示顶点j的度中心性。

10.根据权利要求1至9任一项所述的基于金融社交网络估算合理薪酬的方法,其特征在于,步骤S5包括以下步骤:

S5.1:将包括各人员的网络中心性、公司的市场价值以及薪酬指数的各变量归一化;

S5.2:选择多变量线性回归模型,以人员各网络中心性和公司的市场价值v作为特征自变量,薪酬指数s作为因变量,公式为:

sW=w0+w1·c1+w2·c2+…+wn·cn+wn+1·v

其中w0为偏置,w1,w2,...,wn,wn+1为各特征的权重,c1,c2,...,cn为人员各网络中心性,v为公司市场价值;

S5.3:对模型进行训练与调优,使用随机梯度下降,代价函数使用:

式中,J(W)表示代价函数,反映预测因变量与实际因变量的差距,x(i)是第i个样本的特征,包括网络中心性c1,c2,...,cn和市场价值v,sW(x(i))表示预测的薪酬指数,y(i)表示实际的薪酬指数,m表示样本数量,训练过程中调整超参数,包括学习率,迭代次数,代价函数;

S5.4:测试模型效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911047906.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top