[发明专利]一种基于机器学习模型的排序方法有效

专利信息
申请号: 201811096121.5 申请日: 2018-09-19
公开(公告)号: CN109271132B 公开(公告)日: 2023-07-18
发明(设计)人: 施荣华;毛雷;赵颖;钟增胜;胡超 申请(专利权)人: 中南大学
主分类号: G06F7/24 分类号: G06F7/24;G06N20/00
代理公司: 长沙市融智专利事务所(普通合伙) 43114 代理人: 欧阳迪奇
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机器 学习 模型 排序 方法
【说明书】:

发明公开了一种基于机器学习模型的排序方法,包括以下步骤:第一步,对于给定的待排元素集生成模型训练数据;第二步,根据第一步生成的训练数据利用机器学习的方法构建待排元素集的分布模型;第三步,利用分布模型预测待排元素集中每一个元素在有序数组中的位置;第四步,根据元素的预测位置将元素放入有序数组中,得到一个有序的数组完成排序操作。本发明由于采用将元素直接放入有序数组中的方式,相比于快速排序、归并排序、堆排序等排序算法,运行时间更短。

技术领域

本发明涉及排序算法/系统和机器学习模型领域,具体涉及一种基于机器学习模型的排序方法。

背景技术

排序算法作为经典算法在各类软件开发中都有非常高的使用频率,甚至是在今年来较为火热的聚类分析、机器学习、推荐算法等人工智能领域的基础算法之一。从排序问题提出至今,研究人员和工程人员对排序算法进行了全方位的改进,但是其理论时间复杂度一直停滞在O(NlogN)。随着大数据和机器学习的兴起,计算机需要处理的数据量也越来越大,已有的排序算法难以适应。目前来说对排序算法的优化仅停留在实际运行时间的减少,并没有对理论时间和最坏时间进行进一步优化。目前来说,快速排序和归并排序作为应用较为广泛的排序算法之一,在众多学者和工程师的研究和优化后可以使得大部分的排序过程的时间消耗略微低于理论时间复杂度O(NlogN),效果并不是很理想,没有达到质的改变。

分布模型是由分布函数来表示的一种模型,分布函数既可以是基本函数也可以是不能用解析式表达的抽象函数。目前常见的分布有均匀分布、正态分布、指数分布、二项分布等都是能用解析式表达的分布函数,但是在实际的数据中几乎没有数据是完全符合已知的分布模型且难以用解析式表示。因此通过一般编码的方式难以获得数据的分布情况,可以通过机器学习相关理论和工具来完成对分布函数的拟合和估算。

发明内容

为了解决上述技术问题,本发明提供一种新的排序方法,通过数据分布模型对待排元素在有序数组中的位置进行预测,然后根据元素预测位置将元素放入有序数组从而完成排序操作。这种方法极大的提高了运行的时间效率,且稳定性很强。

为了实现上述技术目的,本发明的技术方案是:

一种使用机器学习模型的排序方法,包括以下步骤:

步骤1):根据待排元素集构建频率分布直方图,并基于直方图中每个区间的值和区间高度分别生成两个序列,将两个序列中的元素分别一一对应形成键值对并汇总为一个集合,来作为数据分布模型的训练数据;

步骤2):先利用单调投影方法对模型的单调性和模型函数的取值区间进行约束,基于上述约束生成初始随机模型,然后使用步骤1)获得的训练数据对初始随机模型进行训练,训练完成后得到数据分布模型;

步骤3):将待排元素集中的元素输入步骤2)获得的数据分布模型,并基于模型输出和待排元素集规模来预测待排元素集中每一个元素在有序数组中的位置;

步骤4):根据步骤3)中获得的预测位置,将各个元素放置在有序数组中。

所述的方法,步骤1)包括以下步骤:

步骤1.1):获得待排元素集规模为N,以横坐标代表待排元素的值,纵坐标代表整个待排元素集在该值区间的元素个数,构建待排序元素集的频率分布直方图;

步骤1.2):将频率直方图中每个区间的最右侧的值依次汇总形成序列K,将每个区间的高度依次汇总形成序列V;

步骤1.3):针对序列V中的第i项,计算从第一项到该项的和,再将这个和值除以N,从而形成序列S,序列S中第i项的Vi计算式为:

步骤1.4):将序列K和序列S中的元素按下标顺序一一对应,形成键值对,将这些键值对汇总成集合D作为训练数据,集合D的表达数如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811096121.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top