[发明专利]基于大数据的区域人才供需平衡量化分析方法有效
申请号: | 201710381505.0 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107239892B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 王蕾;魏墨济;朱世伟;李晨;李宪毅;杨爱芹;于俊凤;李思思;徐蓓蓓;刘翠琴;张明君;董婷;王彦 | 申请(专利权)人: | 山东省科学院情报研究所 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 区域 人才 供需 平衡 量化 分析 方法 | ||
1.一种基于大数据的区域人才供需平衡量化分析方法,包括区域内人才需求相关数据采集、区域内人才供给相关数据采集和区域人才供需平衡量化分析步骤,其特征在于:
所述区域内人才需求相关数据采集通过以下方法来实现:
a).确定人才需求目标数据源和采集范围,优质可量化且能够实时反映区域人才需求的数据是做好分析的前提,因此选取的目标数据源为:招聘网站,大型组织、大学、人社局网站的招聘板块,以及编制招考信息;
由于单独一个区域的分析不能体现本区域的优势及不足,需要对多个同级区域对比分析才能找到问题,为政策的制定提供依据;因此除了采集指定区域外,也将同一行政区下所有与指定区域同级的区域也纳入到采集的范围;
b).采集人才需求目标数据源,大型组织、大学、人社局网站的招聘模块和编制招考信息的更新频率不高,直接采用分布式爬虫的抓取策略采集信息;
由于招聘网站同时服务于诸多实体组织,承载着诸多组织的招聘信息更新频率极高,需要实时获取招聘网站的信息;同时受目标数据源服务器的限制,同一IP地址的爬虫在一定时间内只能采集同一目标服务器限定的数据,故采用将同一招聘网站平均分配到多个爬取节点的方法进行目标数据源的信息采集;
c).人才需求信息提取,由于所采集的人才需求数据是原始的非结构化网页,其中杂陈广告、友情链接、同类推荐无关信息,首先采用DOM树的方法和基于行块分布函数方法抽取目标网页中的数据;然后从非结构化的网页数据中提取包括组织名称、岗位、职位、月薪、学历、工作年限、组织规模、所属行业、组织性质、招聘人数、提供福利、岗位职责、岗位要求、年龄要求、工作地点、发布时间在内的招聘信息,形成结构化数据,每个招聘信息定义一个人才需求指标维度,所有的指标维度组成人才需求指标维度列表;
d).人才需求数据清洗,首先将各指标维度所采用指标体系进行标准化、将各指标维度值进行标准化,以实现指标维度的标准化处理;
然后,将同一媒体、多个媒体中重复发布的招聘信息进行去重处理,以过滤重复发布的信息;
e).人才需求数据存储,所提取的每一个指标维度使用结构化数据库中一列存储,为方便招聘信息的归类统计将所属区域也作为一个人才需求指标维度存储于数据库一列;为方便时间跨度方面的统计分析,将招聘信息的有效持续时间也作为一个人才需求指标维度存储于数据库一列;同时若指标维度是区间标度属性,则在存储过程中将其分成区间起始值和区间终止值分别存储指标维度的首尾值;
所述区域内人才供给相关数据采集通过以下方法来实现:
1).确定人才供给目标数据源和采集范围,人才供给分析的基础是数据,优质可量化,且能够实时反映区域人才供给的数据是做好分析的前提,因此选取的目标数据源为:各类学校的招生信息,并通过比例计算获取不同学历、不同专业人才的供给情况;
由于单独一个区域的分析并不能体现本区域的优势及不足,只有在多个同级区域对比分析中才能找到问题;根据人才流动情况,人们更倾向于就近相邻区域的流动;因此,本系统将同一行政区下所有与指定区域同级的区域也都纳入到采集的范围;
2).采集人才供给目标数据源,采用分布式爬虫采集指定范围内的目标数据源;
3).人才供给信息提取,由于所采集的人才供给数据是原始的非结构化网页,其中杂陈广告、友情链接、同类推荐无关信息,首先采用DOM树的方法和基于行块分布函数方法抽取目标网页中的数据;然后从非结构化的网页数据中提取包括学校名称、专业及招生人数在内的信息,每个信息定义为一个指标维度,同时也将学校所属区域、学校招生批次、学校招生学历列为人才供给指标维度,与提取的指标维度共同构建人才供给指标维度列表;
4).人才供给数据清洗,采用教育部制定的普通高等学校本科专业目录中的专业名称统一不同学校专业名目,实现专业指标维度的标准化处理;
学校每年均会发布招生信息,且每年各学校发布招生信息的时间略有不同,需多次重复扫描含有招生信息的网页;为防止多次采集相同招生信息后重复存储,在采集到招生信息后需要进行清洗,过滤重复发布的信息;
5).人才供给数据存储,所提取的每一个指标维度使用结构化数据库中一列存储,为方便招聘信息的归类统计将网页URL、招生信息媒体来源也作为一个人才供给指标维度存储于数据库一列;区分相同学校不同时间的招生信息以及确定学校供给人才的时间,将招生时间和学制也分别作为人才供给指标维度存储于数据库一列;
所述区域人才供需平衡量化分析步骤通过以下方法来实现:
A).人才供需数据映射,人才需求指标维度中的职位与人才供给指标维度中的专业是人才供需联系的纽带,通过将指标维度职位的取值与指标维度专业的取值映射到相同的空间,以便将人才需求量与人才供给量联系在一起;
B).指标维度分类,指标维度根据其功用分为四类:区域维度、动态维度、目标维度和限定维度,区域维度用于指定分析的目标区域,区域维度的分析可以分成两类:本区域人才供需分析和多区域人才供需对比分析;动态维度的分析可以分成两类:一定时间段的整体宏观分析和时间演化分析;人才供给分析的目标在于向用户展示本区域人才的供需量,目标维度定为供给量和需求量;限定维度用于指定分析的限定条件;
C).分析分类,为使结果条理清晰更易于被用户所理解,采用区域维度和动态维度相组合的方式对分析进行大类划分,分析分为四型分析:Ⅰ型分析、Ⅱ型分析、Ⅲ型分析和Ⅳ型分析;
其中,Ⅰ型分析为本区域一定时间段内整体宏观人才供需分析;Ⅱ型分析为本区域随时间演化人才供需趋势分析;Ⅲ型分析为多区域一定时间段整体宏观人才供需对比分析;Ⅳ型分析为多区域随时间演化人才供需变化趋势对比分析;
D).分析方法,目标维度需求量和供给量的分析结果属于数值型数据,按照分析分类对其进行量化分析;
E).分析结果可视化,通过柱形图直观展现人才需求量和人才供给量的平衡情况及其缺口;
步骤b)中所述的招聘网站的数据采集具体通过以下步骤来实现:
b-1).将所有目标招聘网站的域名分配到全部爬取节点;
b-2).在将域名分给所有爬取节点的同时,为不同的爬取节点分配互不相交的职位类别及标识该职位类别的参数,以此将招聘网站划分成互不相交的子集分配给各爬取节点,每个爬取节点负责一个子集的采集;
b-3).各爬取节点通过招聘网站加所分配职位类别参数的方式,向招聘网站发送请求,获取工作岗位列表,此列表即是需要采集的目标数据源列表URL_Init_List;
b-4).为避免同一时间过于集中地采集同一域名的招聘网站,在得到URL_Init_List后不即刻采集网页,而是将URL_Init_List中的URL地址进行混排生成最终采集目标数据源列表URL_Final_List,混排方法如下:
首先将URL_Init_List中的URL地址按照主机分组划分成若干子列表;然后采用随机方法随机挑选一个子列表,并在该子列表中随机选择一个未被选中过的URL地址放入URL_Final_List;迭代子列表和URL地址的选择过程直至选完所有子列表的所有URL地址;
b-5).爬取节点在得到URL_Final_List后,采集网页数据;
步骤c)中所述的招聘信息的提取通过以下步骤来实现:
c-1).由于每个招聘网站的格式都较为固定,因此首先为每个招聘网站设计模板,然后利用正则表达式提取所需信息,并将从非结构化页面中提取的各个指标维度的值存储于结构化数据库中;
c-2).由于大型组织、大学、人社局网站的招聘板块以及编制招考信息在发布招聘信息时较为随意,没有固定的格式,并会在详情页面中使用表格展示招聘信息,故直接从表格中提取指标维度值,方法如下:
c-2-1).获取表格,在详情页面中由于页面布局的原因可能会存在多个表格的情形,所以首先通过能够标识表格的属性在多个表格中抽取记录招聘信息的表格;
c-2-2).表格去噪,在处理表格时首先去除控制页面显示格式的DIV、CSS及与表格无关的HTML标签,只保留与表格显示和控制相关的table、tr、td、colspan标签;
c-2-3).表格标准化,因为表格无规定格式,在处理过程中分割多行多列的单元格,将表格转化成简单表格,使表格中的每个单元格只占一行一列且只有一个值;
c-2-4).判断表格横竖,判断记录招聘信息的表格是横表还是纵表,取表格的第一行表格的单元格值和第一列表格的单元格值,分别与各个指标维度进行匹配,比较第一行和第一列单元格值的命中率,若第一行单元格值的命中率高则为横表,否则为纵表;
c-2-5).提取键值序列,若表格为横表,则将第一行单元格的值映射到相应的指标维度,相应列单元格的值即为指标维度的值,将无结构的HTML表格转化成结构化的键值对,进而存储到结构化数据库;
若表格为纵表,将第一列单元格的值映射到指标维度,相应行单元格的值即为指标维度的值,提取键值对存储到结构化数据库;
步骤d)中,各指标维度所采用指标体系的标准化方法为:首先,将指标维度使用国家所给出的分类标准的指标体系作为标准指标体系;其次,抽取标准指标体系中的指标作为概念构建本体,将各级指标体系映射到本体概念层次结构的类和子类;再次,抽取指标维度使用的其他指标体系中的指标;最后依据其他指标体系中指标与本体中概念的功能相似性,将其他指标体系中的指标作为概念的实例引入本体,通过本体概念与本体实例之间的关系,建立标准指标体系与其他指标体系之间的映射关系,将指标体系统一到标准指标体系,实现多指标体系指标维度的标准化;
各指标维度值的标准化方法为:针对指标维度值不一致的情形,采用量化表或公式的方式统一指标维度的赋值;首先规定一种赋值为标准值;然后利用量化表或公式,为指标维度的各种不同赋值建立映射关系,将不同的赋值转化为标准值;
同一媒体中重复发布的招聘信息去重方法为:URL是互联网资源的唯一标识,因此判断同一媒体发布的信息是否存在重复的URL,同一URL地址的信息只采集一次即可实现去重;
多个媒体中重复发布的招聘信息去重方法为:同一招聘信息发布于不同媒体其URL地址不同,需要对比不同媒体招聘内容中提取的各个指标维度是否相似,通过以下方法来实现:
d-1).首先对比从不同媒体获取的招聘信息中组织名称是否相同,若相同则对比招聘职位是否相同,若相同执行步骤d-2);
d-2).对比岗位职责和岗位要求的相似度,通过文本相似度算法,若岗位职责和岗位要求的相似度均超过75%,则执行步骤d-3);
d-3).对比不同媒体招聘信息的发布时间,若发布时间差小于7天转入步骤d-4);
d-4).对比结果判定为重复信息,统一不同媒体中各指标维度值;对于序数属性类的指标维度取最低的值作为统一值;对于标称属性类的指标维度取各指标维度值的合集作为统一值;对于区间数值属性类的指标维度取各指标维度值的最小和最大值,按照加权平均的方法求取平均数作为统一值;
d-5).确定非重复招聘信息,若步骤d-1)、d-2)和d-3)中有任意一条不满足,则认为是非重复招聘信息,提取信息后直接存储于结构化数据库中;
步骤2)中所述目标数据源的采集通过以下步骤来实现:
2-1).收集指定区域所处行政区下所有区域的学校列表及其网站URL;
2-2).找出学校网站中与招生信息相关版块的采集入口;
2-3).采集招生版块下的所有网页,通过关键词匹配的方式定位招生信息所处网页;
2-4).采集所定位网页的招生信息;
步骤3)中所述的信息提取中,大多数学校的招生信息会采用表格展示招生信息,然而学校在发布招生信息时并无固定格式较为随意,表格中所出现的指标维度也会较为随意,此种情形很难采用固定的正则表达式来提取数据;直接处理表格从中提取指标维度的值,具体方法如下:
3-1).获取表格,在招生信息页面中由于页面布局的原因可能会存在多个表格的情形,所以首先通过能够标识表格的属性在多个表格中抽取记录招聘信息的表格;
3-2).表格去噪,去除网页中表格中控制页面显示格式的DIV、CSS及与表格无关的HTML标签,只保留与表格显示和控制相关的table、tr、td、colspan标签;
3-3).表格标准化,将表格转化成简单表格,使得表格中的每个单元格只占一行一列且只有一个值;
3-4).判断表格横竖,发布招生信息时既可采用横表,也可采用纵表;因此需要判断记录招生信息的表格是横表还是纵表;取表格的第一行表格的单元格值和第一列表格的单元格值,分别与各个指标维度进行匹配,比较第一行和第一列单元格值的命中率,若第一行单元格值的命中率高则为横表,否则为纵表;
3-5).提取键值序列,若表格为横表,则将第一行单元格的值映射到相应的指标维度,相应列单元格的值即为指标维度的值,将无结构的HTML表格转化成结构化的键值对,进而存储到结构化数据库;若表格为横表纵表,将第一列单元格的值映射到指标维度,相应行单元格的值即为指标维度的值,提取键值对存储到结构化数据库;
如果招生信息附件为Word、Excel或PDF文件,则采用POI解析Word和Excel文档,采用PDFBox解析PDF文档,将其转化为表格,然后再执行步骤3-3)至3-5)。
2.根据权利要求1所述的基于大数据的区域人才供需平衡量化分析方法,其特征在于:步骤4)中,专业指标维度的标准化处理方法为:采用文本的语义相似性度算法最长公共子序列、最小编辑距离或余弦相似度为学校专业名目找出相似度最大的目录专业名称,进而将指标维度专业的值统一到目录中的专业名称中;
多次采集相同招生信息的去重方法为:
4-1).对比招生信息网页的URL是否相同,URL是互联网资源的唯一标识,同一URL地址的信息只需采集存储一次,如相同,则认为是重复招生信息,对其不进行存储;如不同转入4-2);
4-2).对比相同学校招生信息的招生时间是否相同,若相同转入4-3);如不同,认为是非重复招生信息,提取信息后直接存储于结构化数据库中;
4-3).对比相同学校相同时间招生信息的招生专业是否相同,是否有新增加的专业,若相同且无新增专业转入4-4);若不同或有新增专业,则不同专业和新增专业的数据为非重复招生信息,提取信息后直接存储于结构化数据库中;
4-4).对比相同学校相同时间招生信息的招生数量是否相同,若相同则判定为重复信息不再存储,若不同则采用较新时间的招生数量更新数据库中的原有数量;
步骤A)中所述职位的取值与专业的取值映射采用从职位角度的映射方法或从专业角度的映射方法,从职位角度的映射方法如下:
A-1-1).首先,将人才指标维度职位的指标体系作为标准指标体系;
A-1-2).其次,抽取标准指标体系中的指标作为概念构建本体,将各级指标体系映射到本体概念层次结构的类和子类;
A-1-3).再次,抽取指标维度专业指标体系中的指标;
A-1-4).最后依据专业指标体系中指标与本体中概念的语义相似性,将专业指标体系中的指标作为概念的实例引入本体;
A-1-5).通过本体概念与本体实例之间的关系,建立职位指标体系与专业指标体系之间的映射关系,将两套指标体系统一到职位指标体系;
A-1-6).获取每个职位与多个专业的比例对应关系,也即可以获取某个专业有多少百分比对应到一个职位,通过职位的招聘人数和专业的百分比获取对应的供给数量;
从专业角度的映射方法如下:
假设职位列表为Listjob,其中第i个职位为Listjobi;专业列表为Listmajor,第i个专业为Listmajori;使用Nmajor记录数目,第i个专业的数目为Nmajori,初始时令Nmajori为0,职位与专业的对应列表为Listjob_major,第i个职位所对应的第j个专业为Listjobi_majorj;
A-2-1).依次从指标维度职位列表Listjob中获取一个具体职位;
A-2-2).检索人才需求数据,获取该具体职位Listjobi所对应的岗位职责、岗位要求和招聘人数列表Listjobi_psn;
A-2-3).从列表Listjobi_psn中取出一条岗位职责和岗位要求,匹配专业列表Listmajor中的各个专业,假设有Njob_psn个专业被命中,则每个命中Listmajori的专业数目Nmajori为
A-2-4).迭代操作A-2-3),直至Listjobi_psn列表为空,汇总专业Listjobi所命中Listmajori的专业数目Nmajori,计算Listjobi所命中各个专业的占比,将占比记录到Listjobi_majorj;
A-2-5).迭代操作A-2-1)到操作A-2-4),直至Listjob列表为空;
A-2-6).获取每个职位与多个专业的比例对应关系,也即可以获取某个专业有多少百分比对应到一个职位,通过职位的招聘人数和专业的百分比获取对应的供给数量;
步骤C)中所述的四型分析分别通过以下步骤来实现:
Ⅰ型供需平衡量化分析,从多角度多层面对指定区域的人才供需量做出有效分析,分析流程如下:
C-1-1).首先,在区域维度中选择一个区域作为分析区域;
C-1-2).其次,在动态维度中选择一个时段作为分析时段;
C-1-3).再次,在限定维度中选择0到2个指标维度作为分析的限定条件,限定维度的选择并无任何要求,可以不选择任一限定维度,也可以选择一个限定维度的一个值或多个值,还可以选择多个限定维度,每个限定维度选择一个值或每个限定维度选择多个值;
C-1-4).最后,选择目标维度供需量作为分析对象;
若未指定限定维度,可宏观地说明划定时间段内指定区域总的人才供需平衡情况;若指定单一限定维度,可分析划定时间段内指定区域在不同职位或不同学历人才的供需平衡情况;若指定中全部限定维度,可分析划定时间段内指定区域不同职位和不同学历各种组合的人才供需平衡情况;
Ⅱ型供需平衡量化分析,从多角度对指定区域不同阶段的人才供需平衡的变化做出有效对比分析,分析流程如下:
C-2-1).首先,在区域维度中选择一个区域作为分析区域;
C-2-2).其次,在动态维度中选择对比时段作为分析时段,所选定的对比时段是月度、季度或年度自然时间分割节点;
C-2-3).再次,在限定维度中选择0到2个指标维度作为分析的限定条件,此分析中限定维度的选择并无任何要求,可以不选择任一限定维度,也可以选择一个限定维度的一个值或多个值,还可以选择多个限定维度,每个限定维度选择一个值或每个限定维度选择多个值;
C-2-4).最后,选择目标维度供需量作为分析对象;
若未指定限定维度,可宏观地说明指定区域不同时段人才供需的变化情况,从侧面反映区域内人才的饱和和欠缺程度;通过指定单一限定维度,可分析指定区域在相同职位或相同学历的人才在不同时间段供给平衡的变动情况;通过限定维度的组合,可分析指定区域不同时段职位和学历各种组合的人才供需变动情况;
Ⅲ型供需平衡量化分析,可从多角度对不同区域的人才供需平衡做出有效对比分析,分析流程如下:
C-3-1).首先,在区域维度中选择多个区域作为对比分析区域;
C-3-2).其次,在动态维度中选择一个时段作为分析时段;
C-3-3).再次,在限定维度中选择0到2个指标维度作为分析的限定条件,限定维度的选择并无任何要求,可以不选择任一限定维度,也可以选择一个限定维度的一个值或多个值,还可以选择多个限定维度,每个限定维度选择一个值或每个限定维度选择多个值;
C-3-4).最后,选择目标维度供需量作为分析对象
未指定限定维度,可宏观地对比划定时间段内不同区域的人才供需平衡情况;通过指定单一限定维度,可分析划定时间段内不同区域在相同职位或相同学历人才供需平衡情况;通过限定维度的组合,可分析不同区域相同职位和相同学历不同组合的人才供需平衡情况;
Ⅳ型供需平衡量化分析,从多角度对不同区域不同阶段的人才供需平衡变化做出有效对比分析,分析流程如下;
C-4-1).首先,在区域维度中选择多个区域作为对比分析区域;
C-4-2).其次,在动态维度中选择对比时段作为分析时段,所选定的对比时段是月度、季度或年度自然时间分割节点;
C-4-3).再次,在限定维度中选择0到2个指标维度作为分析的限定条件,此分析中限定维度的选择并无任何要求,可以不选择任一限定维度,也可以选择一个限定维度的一个值或多个值,还可以选择多个限定维度,每个限定维度选择一个值或每个限定维度选择多个值;
C-4-4).最后,选择目标维度供给量作为分析对象;
未指定限定维度,可宏观地分析多个区域不同时段人才供需平衡的变化情况;通过指定单一限定维度,可分析不同区域在相同职位或相同学历不同时间段人才供需平衡的变动;通过限定维度的组合,可分析不同区域不同时段相同职位和相同学历的人才供需平衡变化情况;
步骤D)中所述的分析方法通过以下步骤来实现:
D-1).记录学历和职位两个限定维度的选择顺序;
D-2).按照有序的限定维度、区域维度和动态维度的顺序,记录选中的指标维度及每个选定指标维度选中的值,将其转化成不等长矩阵,其中矩阵每一行代表一个选中的指标维度,一行中的一个元素代表对应指标维度选中的值;
假定包含区域维度和动态维度共选中了idxn个指标维度,选中的指标维度分别为Chose_Index1,Chose_Index2,…,Chose_Indexidxn,每个限定维度选中值的个数为Chose_an1,Chose_an2,…,Chose_anidxn,选中的值分别是Chose_Index1_Atb1,Chose_Index1_Atb2,…,Chose_Index1_Atban1,Chose_Index2_Atb1,Chose_Index2_Atb2,…,Chose_Index2_Atban2,…,Chose_Indexidxn_Atb1,Chose_Indexidxn_Atb2,…,Chose_Indexidxn_Atbanidxn;
则转化的数组共idxn维,第i维为指标维度Chose_Indexi,第i维的长度为Chose_ani,第i维数组的值分别为Chose_Indexi_Atb1,Chose_Indexi_Atb2,…,Chose_Indexi_Atbani;
D-3).取出矩阵第一维数组第一个元素作为根节点,按照深度优先遍历不等长矩阵,将其转化为一棵树,给出了第一维数组第一个元素作为根节点的树;
D-4).取出矩阵第一维数组的后续元素作为根节点,按照深度优先遍历不等长矩阵,将其转化成一棵树;
D-5).迭代操作D-4),直至第一维数组元素为空;
D-6).按照第一维数组的元素顺序,自左至右排列矩阵转化而成多棵树的根节点顺序构建森林,森林中共有Chose_an1棵树;
D-7).首先按照自左至右遍历森林中的树,然后按照深度优先遍历每棵树,记录每一个遍历从树根至叶子所经历的完整路径,[Chose_Index1_Atb1-Chose_Index2_Atb1-Chose_Index3_Atb1-…-Chose_Indexidxn_Atb1]、[Chose_Index1_Atb1-Chose_Index2_Atb1-Chose_Index3_Atb1-…-Chose_Indexidxn_Atb2]、…、[Chose_Index1_Atb1-Chose_Index2_Atb1-Chose_Index3_Atb1-…-Chose_Indexidxn_Atbanidxn],共有Chose_an1×Chose_an2×…×Chose_anidxn条路径;
D-8).结合属性值所属指标维度,将一条遍历路径转化为一条数据查询限定规则;路径[Chose_Index1_Atb1-Chose_Index2_Atb1-Chose_Index3_Atb1-…-Chose_Indexidxn_Atb1]转化为一条规则:Chose_Index1 matches Chose_Index1_Atb1 And Chose_Index2matches Chose_Index2_Atb1 And Chose_Index3 matches Chose_Index3_Atb1 And…AndChose_Indexidxn matches Chose_Indexidxn_Atb1,共有Chose_an1×Chose_an2×…×Chose_anidxn条数据查询规则;
D-9).按照顺序抽取一条数据查询规则,在抓取的数据中查询满足前述查询规则的供给量数据集合Supply_Dataseti和需求量集合Demand_Dataseti,最后分别对Supply_Dataseti和Demand_Dataseti进行统计求和获取结果Supply_Resulti和Demand_Resulti;
D-10).迭代操作D-9),直至抽取完所有的数据查询规则,汇总每条数据查询规则所获得的结果Supply_Resulti和Demand_Resulti,返回量化分析结果Supply_Result和Demand_Result
步骤E)中所述的柱形图的生成方法如下:
E-1).初始时令选择多值的维度数Dimension_Count=0;
E-2).查看区域维度、动态维度和限定维度,计算选择多值的维度数,
若区域维度选择了多个区域,则Dimension_Count加1;
若动态维度选择了多个对比时段,则Dimension_Count加1;
从限定维度中取出一个指标维度,若该指标维度选择了多个值,则Dimension_Count加1,迭代此操作,直至限定维度中的指标维度为空;
E-3).若Dimension_Count的值等于0,表明除目标维度供需量,其余指标维度至多选取了一个值,则最终得到的结果为供给量和需求量两个数值,可直接采用一个柱形图展现;
E-4).若Dimension_Count的值大于等于1,表明除目标维度外,至少有一个指标维度选择了多个值,假定选中了多值的指标维度个数为idxn;
E-4-1).若选择了多值的指标维度中包含区域维度或动态维度,则将含有多值的区域维度或动态维度标识为Chose_Indexidxn,将其他选择了多值的限定维度按照选择顺序依次标识为Chose_Indexidxn-1,Chose_Indexidxn-2,…,Chose_Index1;
E-4-2).若选择了多值的指标维度中包含区域维度和动态维度,则将动态维度标识为Chose_Indexidxn,将区域维度标识为Chose_Indexidxn-1,将其他选择了多值的限定维度按照选择顺序依次标识为Chose_Indexidxn-2,Chose_Indexidxn-3,…,Chose_Index1;
E-4-3).若选择了多值的指标维度中不包含区域维度和动态维度,将选择了多值的限定维度按照选择顺序依次标识为Chose_Indexidxn,Chose_Indexidxn-1,…,Chose_Index1;
假定限定维度Chose_Index1,Chose_Index2,…,Chose_Indexidxn选定值的个数分别是ChIdxN1,ChIdxN2,…,ChIdxNidxn;
首先,使用限定维度Chose_Index1,Chose_Index2,…,Chose_Indexidxn构建一个ChIdxN1×ChIdxN2×...×ChIdxNidxn行idxn+1列的表格,表格的第1列到第idxn列分别对应指标维度Chose_Index1,…,Chose_Indexidxn;表格第i行j列单元格的值则为限定维度Chose_Indexj第个值,其中jidxn;
然后,为使图表单元格的显示更为整洁,将相同值的单元格进行合并,也即后第j列的每个单元格需合并ChIdxNj+1×ChIdxNj+2×...×ChIdxNidxn个小单元格,合并后的单元格i将取Chose_Indexj的第i个值;
最后,第idxn+1列有ChIdxN1×ChIdxN2×...×ChIdxNidxn个单元格,每个单元格中包含一个反应供给和需求平衡情况柱形图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省科学院情报研究所,未经山东省科学院情报研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710381505.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的招投标审核方法
- 下一篇:一种卷尺式升降吊灯
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置