[发明专利]一种展示家族迁徙历史以及家族发展状况的可视化方法有效
申请号: | 201811158830.1 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109299167B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 夏理超;陈锦言 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/248 | 分类号: | G06F16/248;G06F16/953;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 展示 家族 迁徙 历史 以及 发展 状况 可视化 方法 | ||
1.一种展示家族迁徙历史以及家族发展状况的可视化方法,步骤如下:
(1)整理人物信息
对数据进行预处理,形成包含人物名字,人物户籍所在地经纬度,人物生活朝代,人物父亲,人物成就信息,其中人物成就信息包括:人物的文学著作,人物的职业,人物入仕方式,人物社会关系,人物的亲戚关系,人物参与的重大事件;
(2)计算人物影响力,方法如下:
利用爬虫技术获取已存文学著作的搜索引擎词条关注度,按照公式(1)计算人物文学著作的影响力因子;按照中国古代职业地位对人物职业进行评分,按照公式(2)计算人物职业影响力因子;对人物参与的重大事件统计搜索引擎词条关注度,并将其影响力因子标准化范围至0-100,对人物参与的重大事件影响力因子进行加分,计算公式为公式(3),按照人物被依附的度统计人物社会关系影响力如公式(4),最终人物社会影响力的总体评分如公式(5):
I1代表人物文学著作的影响力因子,P1i代表人物参与编著的第i部著作的影响力因子,E1目前数据库中已存的任意著作的影响力因子;
I2代表人物职业的影响力因子,P2i代表人物所从事的第i种职业的影响力因子;
I3代表人物参与的重大事件的影响力因子,P3i代表人物参与的第i次重大事件的影响力因子,E3目前数据库中已存的任意重大事件的影响力因子;
I4代表人物社会关系的影响力因子,P4代表依附该人物的人数,E4目前数据库中已存任意人物被依附的人数;
Isum=I1+I2+I3+I4 公式(5)
Isum代表人物的影响力;
(3)建立人物家谱图
通过递归算法,对每一个人不断递归查找人物的父子关系,并进行规则匹配,规则为:0父亲出生时间-儿子出生时间100,直至无法发现父子关系为止,记录当前的人物为同一族的祖先;最终得到的祖先为同一个人的所有人物为同一族人;
(4)人物影响力的可视化
采用玫瑰花图作为同一朝代,户籍为同一地点的与人物为同一祖先的所有族人的影响力可视化图,其中玫瑰画图每个花瓣的面积代表每个人物影响力的大小,总的玫瑰花的面积代表所有生活在同一朝代,同一地点的所有族人的影响力的总和,代表人物所在家族的兴盛程度和社会声望;
(5)家族迁徙历程可视化
带箭头的动态直线代表人物家族的迁徙方向和迁徙规模,同时记录每次迁徙发生的朝代,迁徙直线的箭头代表人物家族迁徙的方向,直线的两端分别代表家族的原地址与迁徙目的地,直线的宽度代表迁徙的族人数量;
(6)家族迁徙原因预测
整理数据库中可能影响家族迁徙的各种因素,置1和置0分别表示存在和不存在,首先采用PCA降维算法,对特征进行降维,防止过拟合,之后采用多分类逻辑回归算法对降维之后的数据进行模型训练,采用交叉验证的方式平衡方差和偏差,通过不断的调试PCA降维之后的维度和逻辑回归模型的训练参数使模型的准确率达到最大值,并保存模型,最终生成的模型对已有记录的每次迁徙做出预测;
(7)家族迁徙以及社会影响力的时空可视化
以朝代为时间坐标轴,二维地图为平面标记人物生活的地理位置,同时显示已作出预测的迁徙的原因,随时间变化动态展示人物家族迁徙的过程以及人物所在家族社会影响力的变化过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811158830.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金融数据的展示方法及系统
- 下一篇:一种互联网大数据可视化分析系统