[发明专利]基于文本履历信息的信息可视化方法及智能可视分析系统有效
| 申请号: | 201410496047.1 | 申请日: | 2014-09-25 |
| 公开(公告)号: | CN104318340B | 公开(公告)日: | 2017-07-07 |
| 发明(设计)人: | 王浩;张晨;徐帆江;王微 | 申请(专利权)人: | 中国科学院软件研究所 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/30 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 司立彬 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文本 履历 信息 可视化 方法 智能 可视 分析 系统 | ||
1.一种基于文本履历信息的信息可视化方法,其步骤为:
1)对每一文本履历信息中的经历信息,进行经历等级量化计算,得到成长轨迹序列数据,并将该数据进行可视化;
2)选取多份文本履历信息的成长轨迹序列数据进行关联计算,得到文本履历间的潜在社交关系,并将该潜在社交关系进行社交网络可视化;
3)基于履历间的潜在社交关系,构建人员所在单位的组织层级可视化表达,将具有单位交集的履历转化成相应单位的组织层级关系,并将该组织层级关系进行组织机构可视化;
其中,所述基于履历间的潜在社交关系,构建人员所在单位的组织层级的组织机构可视化方法为:
31)将所述潜在社交关系记录为一矩阵R,矩阵元素Rij代表履历Mi和履历Mj之间的潜在社交关系;
32)建立一组织机构库V,用于保存所有的组织机构及其成员信息;其中库中元素为树状结构,树的根节点为组织名称,叶节点为成员信息,其具体结构为:<组织名称,<成员1,职务1,是否现任>,<成员2,职务2,是否现任>,…,<成员m,职务m,是否现任>>;
33)遍历矩阵R,如果Rij所代表的履历Mi和履历Mj存在单位交集,则将该单位以及履历Mi和履历Mj保存至该组织机构库V;
34)将V中的所有元素按照所述树状结构,采用组织机构可视化方法进行可视化表达。
2.如权利要求1所述的方法,其特征在于如果履历为非结构化文本履历,则首先将其转换为结构化的文本履历信息,其方法为:
1)对非结构化文本履历进行格式过滤,获得包含履历信息的纯履历文本;
2)利用自然语言处理技术对纯履历文本进行分词与命名实体识别,然后进行履历特征要素抽取,处理得到包含履历要素的结构化文本块;
3)将包含履历要素的结构化文本块进行格式转化,形成结构化的文本履历信息。
3.如权利要求2所述的方法,其特征在于所述结构化的文本履历信息包括:履历基本信息和经历信息表;所述履历基本信息包括姓名、性别、民族和出生地,所述经历信息表为一个表结构,表头包含开始时间、终止时间、地点、单位、职务字段。
4.如权利要求3所述的方法,其特征在于对于单位履历特征要素,采用关键字匹配算法进行履历特征要素的抽取:首先创建一单位关键词词典,所述单位关键词词典中每一行元素包括关键字和辅助关键字两部分信息,其中,辅助关键字包括R型和L型两种,多个辅助关键字用逗号相隔;然后利用单位关键词词典进行单位要素识别:当识别到了词典中的某一关键字,且其右侧无R型辅助关键字,同时左侧无L型辅助关键字时,则识别成功;反之,识别失败;对于其他履历特征要素,采取正则表达式匹配法进行履历特征要素的抽取。
5.如权利要求3所述的方法,其特征在于得到所述成长轨迹序列数据的方法为:
1)对每一文本履历信息的经历信息表按照开始时间字段进行升序排序,得到有序经历信息表;
2)逐条扫描有序经历信息表中的记录,从每一条记录中提取出地点、单位与职务字段,并将各个字段值分别与已有的经历等级量化库进行比对识别,对匹配的实体赋予设定的量化量级;
3)将包含不同量级大小的经历段集合组成有序序列,得到所述成长轨迹序列数据。
6.如权利要求1或5所述的方法,其特征在于所述成长轨迹序列数据为一六元组,即<起始时间,终止时间,地点,单位,职务,量化等级>。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410496047.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





