[发明专利]一种基于机器学习模型的排序方法有效
| 申请号: | 201811096121.5 | 申请日: | 2018-09-19 |
| 公开(公告)号: | CN109271132B | 公开(公告)日: | 2023-07-18 |
| 发明(设计)人: | 施荣华;毛雷;赵颖;钟增胜;胡超 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F7/24 | 分类号: | G06F7/24;G06N20/00 |
| 代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 欧阳迪奇 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 模型 排序 方法 | ||
本发明公开了一种基于机器学习模型的排序方法,包括以下步骤:第一步,对于给定的待排元素集生成模型训练数据;第二步,根据第一步生成的训练数据利用机器学习的方法构建待排元素集的分布模型;第三步,利用分布模型预测待排元素集中每一个元素在有序数组中的位置;第四步,根据元素的预测位置将元素放入有序数组中,得到一个有序的数组完成排序操作。本发明由于采用将元素直接放入有序数组中的方式,相比于快速排序、归并排序、堆排序等排序算法,运行时间更短。
技术领域
本发明涉及排序算法/系统和机器学习模型领域,具体涉及一种基于机器学习模型的排序方法。
背景技术
排序算法作为经典算法在各类软件开发中都有非常高的使用频率,甚至是在今年来较为火热的聚类分析、机器学习、推荐算法等人工智能领域的基础算法之一。从排序问题提出至今,研究人员和工程人员对排序算法进行了全方位的改进,但是其理论时间复杂度一直停滞在O(NlogN)。随着大数据和机器学习的兴起,计算机需要处理的数据量也越来越大,已有的排序算法难以适应。目前来说对排序算法的优化仅停留在实际运行时间的减少,并没有对理论时间和最坏时间进行进一步优化。目前来说,快速排序和归并排序作为应用较为广泛的排序算法之一,在众多学者和工程师的研究和优化后可以使得大部分的排序过程的时间消耗略微低于理论时间复杂度O(NlogN),效果并不是很理想,没有达到质的改变。
分布模型是由分布函数来表示的一种模型,分布函数既可以是基本函数也可以是不能用解析式表达的抽象函数。目前常见的分布有均匀分布、正态分布、指数分布、二项分布等都是能用解析式表达的分布函数,但是在实际的数据中几乎没有数据是完全符合已知的分布模型且难以用解析式表示。因此通过一般编码的方式难以获得数据的分布情况,可以通过机器学习相关理论和工具来完成对分布函数的拟合和估算。
发明内容
为了解决上述技术问题,本发明提供一种新的排序方法,通过数据分布模型对待排元素在有序数组中的位置进行预测,然后根据元素预测位置将元素放入有序数组从而完成排序操作。这种方法极大的提高了运行的时间效率,且稳定性很强。
为了实现上述技术目的,本发明的技术方案是:
一种使用机器学习模型的排序方法,包括以下步骤:
步骤1):根据待排元素集构建频率分布直方图,并基于直方图中每个区间的值和区间高度分别生成两个序列,将两个序列中的元素分别一一对应形成键值对并汇总为一个集合,来作为数据分布模型的训练数据;
步骤2):先利用单调投影方法对模型的单调性和模型函数的取值区间进行约束,基于上述约束生成初始随机模型,然后使用步骤1)获得的训练数据对初始随机模型进行训练,训练完成后得到数据分布模型;
步骤3):将待排元素集中的元素输入步骤2)获得的数据分布模型,并基于模型输出和待排元素集规模来预测待排元素集中每一个元素在有序数组中的位置;
步骤4):根据步骤3)中获得的预测位置,将各个元素放置在有序数组中。
所述的方法,步骤1)包括以下步骤:
步骤1.1):获得待排元素集规模为N,以横坐标代表待排元素的值,纵坐标代表整个待排元素集在该值区间的元素个数,构建待排序元素集的频率分布直方图;
步骤1.2):将频率直方图中每个区间的最右侧的值依次汇总形成序列K,将每个区间的高度依次汇总形成序列V;
步骤1.3):针对序列V中的第i项,计算从第一项到该项的和,再将这个和值除以N,从而形成序列S,序列S中第i项的Vi计算式为:
步骤1.4):将序列K和序列S中的元素按下标顺序一一对应,形成键值对,将这些键值对汇总成集合D作为训练数据,集合D的表达数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811096121.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:耳机控制方法、装置、电子设备及存储介质
- 下一篇:一种数据处理方法及系统





