[发明专利]查询推荐方法、装置、电子设备及可读存储介质在审
申请号: | 202110420976.4 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113342862A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 张学涛 | 申请(专利权)人: | 北京房江湖科技有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06N20/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨云云 |
地址: | 101309 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 推荐 方法 装置 电子设备 可读 存储 介质 | ||
本发明提供一种查询推荐方法、装置、电子设备及可读存储介质,其中所述方法包括:获取用户输入的查询请求,并基于查询请求,获取用户物料的基础特征;利用预设特征处理配置和预设特征处理算子,对基础特征进行特征处理,获取目标特征;基于目标特征,利用查询推荐模型,输出匹配的查询推荐结果;其中,查询推荐模型为利用训练样本特征进行离线训练获取,训练样本特征为利用预设特征处理配置和预设特征处理算子对离线环境下的用户物料样本特征进行特征处理获取。本发明通过设定离线环境和生产环境可以共用的特征处理配置和特征处理算子,可保证线上、线下配置和处理算子的一致性,从而能够有效简化开发流程,提高开发效率并降低维护成本。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种查询推荐方法、装置、电子设备及可读存储介质。
背景技术
在使用基于机器学习的网络模型进行搜索排序或推荐排序时,需要用到用户以及物料的相关特征。由于不同特征的数值所代表的含义和数值范围通常会不一致,因此需要通过特征处理将不同特征归一化至同一尺度范围内,以方便利用机器模型进行处理。
目前,在开发相关机器模型时,通常在离线环境下进行。如图1所示,为根据现有技术的查询推荐方法的流程示意图,其中采用离线方式获取目标模型。离线过程一般采用基于Python的特征处理方法,也即使用PySpark,按照预先定义的特征处理配置进行特征处理,得到训练数据,然后利用这些训练数据训练得到理想的模型,将该模型发布至生产环境。之后,生产环境需要按照定义好的特征处理配置,使用基于Java的特征处理方法,对生产过程实际的用户物料基础特征进行特征处理,得到特征处理结果,并基于此进行生成实际预测。
发明内容
本发明提供一种查询推荐方法、装置、电子设备及可读存储介质,用以解决现有技术开发流程复杂,效率低,且易出现错误,维护成本较高的缺陷,实现简化开发流程,提高开发效率并降低维护成本的目标。
本发明提供一种查询推荐方法,包括:
获取用户输入的查询请求,并基于所述查询请求,获取用户物料的基础特征;
利用预设特征处理配置和预设特征处理算子,对所述基础特征进行特征处理,获取目标特征;
基于所述目标特征,利用查询推荐模型,输出匹配的查询推荐结果;
其中,所述查询推荐模型为利用训练样本特征进行离线训练获取,所述训练样本特征为利用所述预设特征处理配置和所述预设特征处理算子,对离线环境下的用户物料样本特征进行特征处理获取。
根据本发明一个实施例的查询推荐方法,在所述利用查询推荐模型,输出匹配的查询推荐结果之前,还包括:
离线获取预定数量的历史查询请求,并基于所述历史查询请求,获取所述用户物料样本特征;
利用所述预设特征处理配置和所述预设特征处理算子,对所述用户物料样本特征进行特征处理,获取所述训练样本特征;
基于用户设定的查询需求,搭建初始查询推荐模型,并利用所述训练样本特征,训练所述初始查询推荐模型,获取所述查询推荐模型。
根据本发明一个实施例的查询推荐方法,在所述利用预设特征处理配置和预设特征处理算子,对所述基础特征进行特征处理之前,还包括:
获取文件格式标准,并基于所述文件格式标准,生成特征处理配置文件,且获取所述预设特征处理配置。
根据本发明一个实施例的查询推荐方法,所述设定文件格式标准,包括:
设定所述文件格式标准如下:
process_handler:featureHandler
feature_name:feature_name_a,feature_name_b
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京房江湖科技有限公司,未经北京房江湖科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110420976.4/2.html,转载请声明来源钻瓜专利网。