[发明专利]基于图形处理单元的并行排序学习方法及系统有效
| 申请号: | 201310632348.8 | 申请日: | 2013-11-29 |
| 公开(公告)号: | CN103605493A | 公开(公告)日: | 2014-02-26 |
| 发明(设计)人: | 叶允明;范希贤;黄晓辉 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
| 主分类号: | G06F7/08 | 分类号: | G06F7/08 |
| 代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 于标 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图形 处理 单元 并行 排序 学习方法 系统 | ||
1.一种基于图形处理单元的并行排序学习方法,其特征在于,包括如下步骤:
构建查询及文档偏序对:针对每个查询,根据训练集中文档与查询的相关度构建出文档偏序对,每一个文档偏序对为一个模型的训练样本,根据每一个查询的相关度列表构建成文档偏序对集;
模型参数训练:根据文档偏序对集估计模型参数,通过估计评分函数中关于每个特征的权重参数取值;
文档评分:根据模型参数训练步骤中估计出的模型参数和文档评分函数计算每个文档的得分;
文档排序:根据每个文档的得分,选择排序算法对文档进行排序,然后把排序后的结果提供给查询用户。
2.根据权利要求1所述的并行排序学习方法,其特征在于:在所述构建查询及文档偏序对步骤中,在训练样本中,每一个查询对应一个文档列表,列表中给出文档与查询语句的相关度;在所述文档评分步骤中,采用线性评分模型,其评分模型函数为公式中,Θi为模型参数向量中的第i维,fji文档dj中的第i个特征值;在所述文档排序步骤中,采用双调排序对文档进行排序。
3.根据权利要求1所述的并行排序学习方法,其特征在于:在所述模型参数训练步骤中,采用最大似然方法估计模型参数,似然函数为:
公式中,q是查询集Q中的一个查询,Θ为要估计的模型参数,i、j分别为第i、j个文档,(q,i,j)表示第q个查询项,由第i、j个文档组成的查询及文档偏序对,DS为所有查询及文档偏序对样本集,δ为指示函数,为在模型参Θ下产生查询及文档偏序对的概率。
4.根据权利要求1所述的并行排序学习方法,其特征在于:在所述构建查询及文档偏序对步骤中,针对每个查询开启一个核函数的线程,采用基于图形处理的多线程并行构建查询及文档偏序对;在所述模型参数训练步骤中,针对于每个查询及文档偏序对开启一个核函数的线程,采用基于图形处理的多线程并行更新模型参数;在文档评分步骤中,针对于每个文档开启一个核函数的线程,采用基于图形处理的多线程并行文档评分。
5.一种基于图形处理单元的并行排序学习系统,其特征在于,包括:并行构建查询及文档偏序对模块:用于针对每个查询,根据训练集中文档与查询的相关度构建出文档偏序对,每一个文档偏序对为一个模型的训练样本,根据每一个查询的相关度列表构建成文档偏序对集;
并行模型参数训练模块:用于根据文档偏序对集估计模型参数,通过估计评分函数中关于每个特征的权重参数取值;
并行文档评分模块:用于根据模型参数训练步骤中估计出的模型参数和文档评分函数计算每个文档的得分;
并行文档排序模块:用于根据每个文档的得分,选择排序算法对文档进行排序,然后把排序后的结果提供给查询用户。
6.根据权利要求5所述的并行排序学习系统,其特征在于:在所述并行构建查询及文档偏序对模块中,在训练样本中,每一个查询对应一个文档列表,列表中给出文档与查询语句的相关度;在所述文档评分步骤中,采用线性评分模型,其评分模型函数为公式中,Θi为模型参数向量中的第i维,fji文档dj中的第i个特征值;在所述文档排序步骤中,采用双调排序对文档进行排序。
7.根据权利要求5所述的并行排序学习系统,其特征在于:在所述并行模型参数训练模块中,采用最大似然方法估计模型参数,似然函数为:
公式中,q是查询集Q中的一个查询,Θ为要估计的模型参数,i、j分别为第i、j个文档,(q,i,j)表示第q个查询项,由第i、j个文档组成的查询及文档偏序对,DS为所有查询及文档偏序对样本集,δ为指示函数,为在模型参Θ下产生查询及文档偏序对的概率。
8.根据权利要求5所述的并行排序学习系统,其特征在于:在所述并行构建查询及文档偏序对模块中,针对每个查询开启一个核函数的线程,采用基于图形处理的多线程并行构建查询及文档偏序对;在所述并行模型参数训练模块中,针对于每个查询及文档偏序对开启一个核函数的线程,采用基于图形处理的多线程并行更新模型参数;在并行文档评分模块中,针对于每个文档开启一个核函数的线程,采用基于图形处理的多线程并行文档评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310632348.8/1.html,转载请声明来源钻瓜专利网。





