[发明专利]基于最短路径覆盖的测地距离保持算法在审
申请号: | 201810824782.9 | 申请日: | 2018-07-23 |
公开(公告)号: | CN109033349A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 马争鸣;王鑫;车航健;陈映宏;黎伟浚 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及机器学习领域中的数据降维问题,提出了一种基于最短路径覆盖的测地距离保持算法。首先从由输入样本构造的邻域图中选取一系列与真实测地线尽量接近的最短路径来覆盖所有的数据点。用MDS保持选取的测地线的起点与终点之间的测地距离将所有的起点和终点映射到低维空间。由每一对起点和终点的低维坐标可以确定低维空间中的一条直线。本发明的主要思想是将高维空间中处于一条测地线上的点映射到低维空间中的一条直线上,故高维空间中数据点的低维坐标可以根据它们与起点之间的测地距离来预测,最后通过最小化数据点的低维坐标与其预测值之间的误差来得到所有数据点的低维坐标。 | ||
搜索关键词: | 测地距离 低维 低维空间 最短路径 数据点 高维空间 测地线 映射 算法 覆盖 机器学习领域 输入样本 数据降维 最小化 预测 地线 邻域 实测 | ||
【主权项】:
1.一种基于最短路径覆盖的测地距离保持算法,其主要特征在于:A.构造输入数据集X的邻域图G。从数据集X中随机选取一个数据点xp,计算出以该点为起点的所有最短路径以及每条最短路径偏离真实测地线的程度;B.从以xp为起点的所有最短路径中选出一条包含数据点尽量多而且尽量接近真实测地线的最短路径;C.从数据集中剔除C中得到的最短路径所包含的点并重复B到C直到数据集为空,得到一系列能覆盖所有数据点的最短路径集合;D.将所有最短路径的起点和终点收集起来,记为
对XF应用MDS保持所有起点和终点之间的测地距离得到
E.每条最短路径的起点和终点在低维空间中的坐标可以确定低维空间中的一条直线,算法的基本思想是将高维空间中处于一条测地线上的点映射为低维空间中一条直线上的点,因此处于最短路径上的其它点的低维坐标可以由该条最短路径的起点和终点的低维坐标来预测;F.最小化所有数据点的实际低维坐标和它们由上述起点和终点预测得到的低维坐标之间的误差来获得所有数据点的低维坐标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810824782.9/,转载请声明来源钻瓜专利网。