[发明专利]分类方法及装置有效
申请号: | 201910935860.7 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110674372B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 张琪;程军;孙明芳;颜振祥 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/906;G06K9/62 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 方法 装置 | ||
本申请公开了分类方法及装置,涉及计算机领域,尤其涉及网络搜索领域。具体实现方案为:根据记录搜索行为的网络日志获得搜索请求样本;所述搜索请求样本为针对同一目标内容的视频访问的请求样本;所述搜索请求样本包括搜索请求;将所述搜索请求样本输入分类模型,获得第一分类结果;根据每个分类所包括的搜索请求的数量和所述搜索请求样本中的搜索请求总数量,获得第二分类结果;根据所述第一分类结果和第二分类结果,获得所述目标内容的分类。本申请实施例能够实现搜索请求对应的目标内容的分类,并且能够获得符合用户习惯和真实网络访问状况的分类结果。
技术领域
本申请涉及计算机领域,尤其涉及网络搜索领域。
背景技术
商业搜索引擎为了更好地满足用户的需求,需要对用户的query(请求)进行需求类别的识别。例如,美食烹饪、歌舞表演、足球运动等。识别了用户的需求类别之后,在检索结果召回及排序的过程中,利用这种分类结果,将更能满足用户需求的结果在排序中进行优待。
传统的搜索请求分类是基于网页搜索建立的,近年来,互联网中的富媒体资源越来越多,用户的搜索查询需求也越来越多,种类也趋于多样化。例如,采用机器学习算法利用网页的标题、内容和站点信息等,拟合基于人工标注的搜索查询需求(query)类别。但是,利用机器学习算法对搜索查询需求进行分类,需要人工标注大量的样本,耗费大量的人力、时间和经济成本。
发明内容
为了解决现有技术中的问题,本申请提供一种分类方法及装置。
第一方面,本申请提供一种分类方法,包括:
根据记录搜索行为的网络日志获得搜索请求样本;所述搜索请求样本为针对同一目标内容相关的视频进行访问的请求样本;所述搜索请求样本包括搜索请求;
将所述搜索请求样本输入分类模型,获得第一分类结果;
根据每个分类所包括的搜索请求的数量和所述搜索请求样本中的搜索请求总数量,获得第二分类结果;
根据所述第一分类结果和第二分类结果,获得所述目标内容的分根据第一分类结果和第二分类结果,获得目标内容的分类。
在本申请实施例中,通过网络日志获得搜索请求样本,获取的是用户真实搜索行为记录,从而在多需求下能够区分主需求和次需求,并且通过自动分类处理,能够解决了分类体系庞大、分类难的问题。模型输出的分类结果和根据网络日志实际数据计算的分类结果具有互补的作用。根据网络日志获得的搜索请求样本直接计算获得的第二分类结果,能够更快地反映出目标内容对应的分类的变化情况。利用模型获得的第一分类结果,对低频数据具有更高的准确性。因此通过本申请实施例提供的分类方法,能够获得较准确的分类结果。
在一种实施方式中,第一分类结果为目标内容属于第一分类的第一打分,第二分类结果为目标内容属于第一分类的第二打分,根据第一分类结果和第二分类结果,获得目标内容的分类,包括:
对第一分类结果和第二分类结果进行线性加权,获得目标内容的分类。
本申请实施例能够结合两种分类结果获得目标内容的分类,从而提高分类的准确性。
在一种实施方式中,根据记录搜索行为的网络日志获得搜索请求样本,包括:
根据网络日志中的用户需求信息,获得搜索请求样本;
目标内容的分类为与用户需求信息相关的分类。
本申请实施例利用用户需求信息对目标内容进行分类,使得分类结果更符合用户需求。
在一种实施方式中,根据第一分类结果和第二分类结果,获得目标内容的分类之后,还包括:
根据目标内容的分类和与目标内容相关的搜索结果的分类,确定搜索结果在目标内容的搜索结果列表中的排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910935860.7/2.html,转载请声明来源钻瓜专利网。