[发明专利]一种曲线拟合的检验方法在审
| 申请号: | 201710429498.7 | 申请日: | 2017-06-08 |
| 公开(公告)号: | CN108228534A | 公开(公告)日: | 2018-06-29 |
| 发明(设计)人: | 韩超;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
| 主分类号: | G06F17/15 | 分类号: | G06F17/15 |
| 代理公司: | 广东莞信律师事务所 44332 | 代理人: | 余伦 |
| 地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型函数 平方和 曲线拟合 数据集 对数函数 使用数据 数据分析 线性模型 最优模型 关联性 幂函数 求解 检验 挖掘 分析 | ||
本发明涉及数据分析挖掘技术领域,具体涉及一种数据集的曲线拟合的检验方法。本发明方法是先设定相关性判断值;然后,对数据集进行相关性分析,如果相关性r大于判断值,表示关联性极强,则使用线性模型函数;否则,使用数据集对多项式二次、多项式三次、多项式五次、幂函数和对数函数这五种模型函数分别进行计算,求解各模型函数的系数,得到具体的模型函数;然后比较各个点到模型函数距离的平方和的大小,选择平方和值小的模型函数。本发明提供了一种选择最优模型函数的方法。
技术领域
本发明涉及数据分析挖掘技术领域,具体涉及一种数据集的曲线拟合的检验方法。
背景技术
随着云计算和大数据技术的不断发展,数据的分析和挖掘这一环节显得尤为重要。数据的价值需要通过挖掘和分析才能充分地体现出来;而曲线拟合作为比较常用的方法,对数据的分析有着重要的作用。
发明内容
本发明解决的技术问题在于提供一种曲线拟合的检验方法,使得计算更加准确,可提供更优的模型函数的选择。
本发明解决上述技术问题的技术方案是:
所述的方法是先设定相关性判断值;然后,对数据集进行相关性分析,如果相关性r大于判断值,表示关联性极强,则使用线性模型函数;否则,使用数据集对多项式二次、多项式三次、多项式五次、幂函数和对数函数这五种模型函数分别进行计算,求解各模型函数的系数,得到具体的模型函数;然后比较各个点到模型函数距离的平方和的大小,和越小表示拟合的效果越佳,可选择平方和值小的模型函数。
所述的模型函数的数学表达式分别如下:
(1)y=ax+b,线性函数;
(2)y=ax2+bx+c,多项式二次函数;
(3)y=ax3+bx2+c,多项式三次函数;
(4)y=ax5+bx4+cx3+dx2+ex+c,多项式五次函数;
(5)y=axb,幂函数;
(6)y=alogx+b,对数函数。
所述的相关性r的判断值设定为0.8。
使用点到直线的距离的平方和作为衡量的标准,即在曲线上存在某点,使得这点的切线与数据集的某点的连线与切线垂直,并得到其距离。
所述的方法详细流程如下:
(1)、读取外部数据进入缓存;
(2)、分析数据集的相关系数:当ρ>0.8时,直接选择线性拟合,结束本流程;当ρ<0.2时,执行下一步;
(3)、按顺序选择五种模型函数之中的一种计算集合点到曲线的距离的平方和;设曲线为f(x,y)=0,O点为曲线上的切点,则切向量则通过计算以上两方程即可得到切点位置;
(4)、计算距离的平方和。
(5)、存储上一步的距离计算结果d,重复第三步计算,直到所有模型函数的被计算完毕,得到五个距离平方和结果;
(6)、通过对比计算结果,找到最小的距离结果对应的模型函数即为最优的模型函数。
本发明的方法从一系列的检验流程和方法中得出最优的模型函数,为数据的分析提供较为准确的判断。在计算距离时,同时考虑了X、Y的影响,距离计算更为精确。
附图说明
下面结合附图对本发明进一步说明:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710429498.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:物质分析方法及装置
- 下一篇:一种不等精度测量数据融合的最优加权参数估算方法





