[发明专利]一种人物事件的时空信息不确定性的可视化推理方法有效
申请号: | 201911394875.3 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111291243B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 陈为;张玮;谭思危 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/904 | 分类号: | G06F16/904;G06F16/909 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 马士林 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人物 事件 时空 信息 不确定性 可视化 推理 方法 | ||
1.一种人物事件的时空信息不确定性的可视化推理方法,其特征在于,包括以下步骤:
步骤1)建立搜索空间,将人物信息数据和人物生平事件数据存入所述搜索空间中;
步骤2)利用所述搜索空间中数据的时间、位置和事件描述,构建包含人物、事件、地点和时间为节点的异构信息网络关系图;
步骤3)使用图嵌入模型生成所述异构信息网络关系图中节点的向量表达;
步骤4)基于步骤3)得到的向量表达,计算节点间的相似性,并推测不确定时空信息的可能值,得到搜索空间中的辅助线索,为数据中丢失或冲突的信息推荐相关节点信息;
步骤5)对步骤4)中得到的相关节点信息进行筛选,并提供时空维度和人物关系维度的可视交叉分析界面;
步骤3)中,图嵌入的具体过程如下:
将所有的实体,包括人物、事件、地点和时间的唯一标识符看作单词,然后为了对网络中的节点进行向量化,采用随机游走节点的方式生成句子,每个节点的转移概率如下:
其中,Vt是实体集,是Vt周围的节点数,vi+1表示第i+1步的节点,E表示所有的边的集合,t表示节点的类型;随机游走的输出是实体序列,其可以用作所述图嵌入模型的输入;
步骤3)中,所述的图嵌入模型的建模方法采用skip-gram模型,其建立过程包括:
skip-gram模型通过中心词来预测上下文词,输入是中心词的one-hot编码,求其与上下文词的词向量矩阵和投影,然后经过一层softmax得到输出;softmax层的输入是中心词的one-hot的编码的向量,输出是预测词的one-hot编码的向量,隐含层是一个单词数*特征数的权重矩阵,通过神经网络隐含层的计算,中心词从one-hot变成1x特征数的向量,输出层是一个softmax回归分类器,它的每个结点将会输出一个0~1之间的值,即概率,所有输出层神经元结点的概率之和为1;
步骤4)中,计算节点间的相似性的方法为:
基于skip-gram模型中的每个节点的向量,通过cos距离计算得到的,距离越近相似度越大;
所述的可能值的计算采用如下方法:
对于包含不确定地点或时间的事件,寻找与其最相似的包含确定信息的其他事件,将相似的其他事件的地点或时间作为该事件的时间地点;
所述的辅助线索是指可以推荐k个与该事件相近的事件实体,后基于这k个事件实体提出建议,对于不确定时间的事件,可以将最相近的确定事件的时间当做推理结果推荐给用户,同时基于这些事件实体和他们相似的时间、地点和事件描述,系统通过可视化界面并结合领域知识进行推理挖掘;
步骤5)中,所述的可视交叉分析界面包括:
人物事件时间轴视图:利用基于词典的情感分析算法,按照时间顺序展示人物生平起伏,并使用墨痕隐喻影响人生起伏的事件;
地图视图:基于地图,用带有地理位置的饼图呈现每个区域内空间位置信息精确的事件和不精确的事件的比例,饼图的大小编码了事件的数量,地点之间使用连线展示人物的人生轨迹;
交叉推理视图:包含推理内容视图和推理规则视图两部分,完成不确定性的推理过程;
关系矩阵视图:矩阵的每一行和列代表人物,行和列之间交叉表示人物之间存在的关系;
控制面板:用户可以在控制面板选择其他视图要呈现的人物和事件类型;事件的类型被人工分成政治、文学、社交、学术、宗教、军事和其他七类,用户可以筛选想关注的类型的事件;
所述的人物事件时间轴视图中,人物生平起伏的展示过程如下:
长度为t年的滑动窗口被用于截取事件集合来计算人物生平中某个时刻的总分数,公式表示为:
Score(t)=ΣI(Ei)*Score(Ei)/ΣI(Ei)
E表示时间范围类事件的集合,I(Ei)衡量了事件Ei在人生中的重要性,函数Score(Ei)用于计算公式中特定事件Ei的得分:
p是事件涉及人的集合,r是被评价人在Ei中的角色,通过领域通用的Pagerank算法计算人物在知识图谱中的重要度即事件对人生的影响程度;Emotion(Ei,r)是由专家针对目标人物在事件中的角色和事件的标签打分的值,打分依据是事件对角色人生影响的程度,分数的值域为[-10,10];
作为Score(Ei)的权重,I(Ei)是对滑动窗口中事件Ei的重要性的度量,公式为:
其中,f(t)定义为指数衰减函数,表示对特定时间距离t的事件的衰减值:
f(t)=f(0)e-t/T
其中,T是窗口大小,f(0)=1,函数采用文本挖掘中的TF-IDF方法,计算一生中各类型的事件的重要性,以排除常见事件大量出现的影响,并突出生平中不常发生的事件;q(Ei,type)是特定事件类型的权重,由用户在交互界面中调节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911394875.3/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置