[发明专利]搜索处理方法、模型训练方法、装置、介质及设备在审
| 申请号: | 202011303665.1 | 申请日: | 2020-11-19 |
| 公开(公告)号: | CN112364235A | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 王鑫宇;张永华 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/9538;G06K9/62;G06N3/08 |
| 代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李柯莹 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 处理 方法 模型 训练 装置 介质 设备 | ||
本公开涉及一种搜索处理方法、模型训练方法、装置、介质及设备,该搜索处理方法包括:接收目标搜索信息;根据目标搜索信息确定目标搜索结果,并通过相关度确定模型确定目标搜索结果与目标搜索信息之间的目标相关度;其中,相关度确定模型是通过如下方式训练得到的:根据用户对多个历史搜索结果实施的历史操作行为信息,分别确定各个历史搜索结果与历史搜索信息之间的相关度,具有相同目标文本摘要信息的历史搜索结果与历史搜索信息之间的相关度相同;将历史搜索信息和历史搜索结果作为模型的输入,历史搜索结果与历史搜索信息之间的相关度作为模型的目标输出,对模型进行训练,以得到相关度确定模型。如此,使得确定出的目标相关度更为准确。
技术领域
本公开涉及搜索技术领域,具体地,涉及一种搜索处理方法、模型训练方法、装置、介质及设备。
背景技术
在搜索领域,一般是根据用户输入的搜索词或搜索语句等搜索信息进行搜索,以得到对应的搜索结果。搜索结果与用户输入的搜索信息之间的相关度,可反映搜索结果是否符合用户的搜索意图。其中,搜索结果与搜索信息之间的相关度越高,可表征该搜索结果越符合用户的搜索意图。
目前,搜索结果与搜索信息之间的相关度主要通过模型进行确定,模型的训练依赖于预先设置的训练数据,该训练数据可包括已经标注完成的搜索结果与搜索信息之间的相关度。相关技术中,一般是由技术人员对搜索结果与搜索信息之间的相关度进行人工标注,然而训练所需的数据量较大,通过人工标注的方式,效率低下,并且,对相关度进行人工标注受到技术人员主观判断的影响,不够准确。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种搜索处理方法,所述方法包括:接收目标搜索信息;根据所述目标搜索信息确定目标搜索结果,并通过相关度确定模型确定所述目标搜索结果与所述目标搜索信息之间的目标相关度;其中,所述相关度确定模型是通过如下方式训练得到的:根据用户对多个历史搜索结果实施的历史操作行为信息,分别确定各个历史搜索结果与历史搜索信息之间的相关度,其中,具有相同目标文本摘要信息的所述历史搜索结果与所述历史搜索信息之间的相关度相同,所述历史搜索结果是根据用户输入的所述历史搜索信息进行搜索得到的;将所述历史搜索信息和所述历史搜索结果作为模型的输入,所述历史搜索结果与所述历史搜索信息之间的相关度作为模型的目标输出,对所述模型进行训练,以得到所述相关度确定模型。
第二方面,本公开提供一种相关度确定模型训练方法,所述方法包括:根据用户对多个历史搜索结果实施的历史操作行为信息,分别确定各个历史搜索结果与历史搜索信息之间的相关度,其中7,具有相同目标文本摘要信息的所述历史搜索结果与所述历史搜索信息之间的相关度相同,所述历史搜索结果是根据用户输入的所述历史搜索信息进行搜索得到的;将所述历史搜索信息和所述历史搜索结果作为模型的输入,所述历史搜索结果与所述历史搜索信息之间的相关度作为模型的目标输出,对所述模型进行训练,以得到所述相关度确定模型。
第三方面,本公开提供一种搜索处理装置,所述装置包括:接收模块,用于接收目标搜索信息;目标相关度确定模块,用于根据所述目标搜索信息确定目标搜索结果,并通过相关度确定模型确定所述目标搜索结果与所述目标搜索信息之间的目标相关度;其中,所述相关度确定模型是通过如下方式训练得到的:根据用户对多个历史搜索结果实施的历史操作行为信息,分别确定各个历史搜索结果与历史搜索信息之间的相关度,其中,具有相同目标文本摘要信息的所述历史搜索结果与所述历史搜索信息之间的相关度相同,所述历史搜索结果是根据用户输入的所述历史搜索信息进行搜索得到的;将所述历史搜索信息和所述历史搜索结果作为模型的输入,所述历史搜索结果与所述历史搜索信息之间的相关度作为模型的目标输出,对所述模型进行训练,以得到所述相关度确定模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011303665.1/2.html,转载请声明来源钻瓜专利网。





