[发明专利]概率图中选取关键边和优化关键边的方法及存储介质在审
申请号: | 201710506511.4 | 申请日: | 2017-06-28 |
公开(公告)号: | CN109145160A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 林欣;吴永成 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 钟宗;潘一诺 |
地址: | 200333 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 概率图 存储介质 筛选 可达性 查询 条边 概率 优化 连接点 查找 | ||
本发明提供一种概率图中选取关键边和优化关键边的方法及存储介质,所述在概率图中选取关键边的方法包括:输入概率图,所述概率图包括多个点、连接点的边及每条边存在的概率值;输入可达性查询,以查询所述多个点中两个点之间的可达性;查找所查询的两个点之间的所有路径;计算初始图质量;筛选所述所有路径中的边,若所计算的初始图质量小于N,则在所述所有路径中筛选出概率值小于N大于0的边,若所计算的初始图质量大于等于N,则在所述所有路径中筛选出概率值小于1大于等于N的边;以及计算并比较所筛选的每条边的边相关因子,并将边相关因子最大的边作为关键边。本发明提供的方法及存储介质能够高效地选取并优化关键边。
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种概率图中选取关键边和优化关键边的方法及存储介质。
背景技术
图数据是一种结点和边在不同场合(应用)下被赋以特殊意义的数据形式。例如,社交网络是一种结点代表人物,边表示人物件联系的数据图;蛋白质网络则是酶之间相互作用的关系网络,等等。然而,很多情况下产生的数据并非准确,比如,数据源不可靠、数据内容歧义等。比如,当从学术网站(诸如DBLP,Digital Bibliography&Library Project,以作者为核心的一个计算机类英文文献的集成数据库系统;Google Scholar,谷歌学术搜索等)抓取的合著者关系网中出现不同作者相同作者名时,便会造成混淆;在计算机自动生成的知识图中,由于自然语言处理技术的不完善,实体间的关系就会不确定;在蛋白质间的交互关系知识由统计模型产生。为了捕捉数据中的这些不确定性,无向图模型已被广泛采用,图中边被赋以概率值以表示该边存在的概率。
当需要在这些概率图中执行可达性查询时,现有的算法通常较为复杂,系统计算时间过长,且准确率也有待提高。
发明内容
本发明为了克服上述现有技术存在的缺陷,提供一种概率图中选取关键边和优化关键边的方法及存储介质,以高效地选取并优化关键边。
根据本发明的一个方面,提供一种在概率图中选取关键边的方法,包括如下步骤:输入概率图,所述概率图包括多个点、连接点的边及每条边存在的概率值;输入可达性查询,以查询所述多个点中两个点之间的可达性;查找所查询的两个点之间的所有路径;计算初始图质量;筛选所述所有路径中的边,若所计算的初始图质量小于N,则在所述所有路径中筛选出概率值小于N大于0的边,若所计算的初始图质量大于等于N,则在所述所有路径中筛选出概率值小于1大于等于N的边,其中,N大于0小于1;以及计算并比较所筛选的每条边的边相关因子,并将边相关因子最大的边作为关键边。
可选地,所述计算并比较所筛选出的每条边的边相关因子,并将边相关因子最大的边作为关键边包括:将所筛选的每条边按概率值自上而下升序排列,形成第一列表L1;计算所筛选的每条边的边相关因子,将所筛选的每条边按边相关因子自上而下降序排列,形成第二列表L2;确定所述关键边,其中,自上而下依次选取第一列表L1的一条边和第二列表的L2的一条边,对于每次自所述第一列表L1和所述第二列表的L2选取的两条边,依据该两条边的边相关因子判断继续自所述第一列表L1和所述第二列表的L2选取下两条边或者确定所述关键边。
可选地,确定所述关键边包括:对于每次自所述第一列表L1和所述第二列表的L2选取的两条边,将所选的第二列表L2的一条边的边相关因子与所选的第一列表L1的一条边的概率值相除得到值P1,
当max(P2,P3)≤P1时,继续自所述第一列表L1和所述第二列表的L2选取下两条边,其中,P2和P3分别为计算P1时自所述第一列表L1和所述第二列表的L2选取的两条边的边相关因子;
当max(P2,P3)>P1时,将计算P1时自所述第一列表L1和所述第二列表的L2选取的两条边的边相关因子较大的边作为所述关键边。
可选地,所述边相关因子依据如下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710506511.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对数据进行处理的方法和装置
- 下一篇:中文地名查询方法、装置及设备