[发明专利]一种推荐搜索词的方法及系统有效
申请号: | 201210385554.9 | 申请日: | 2012-10-12 |
公开(公告)号: | CN103729359A | 公开(公告)日: | 2014-04-16 |
发明(设计)人: | 宁伟;顾湘余;王倬 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 推荐 搜索词 方法 系统 | ||
技术领域
本发明涉及网络领域,尤其涉及一种推荐搜索词的方法及系统。
背景技术
随着电子商务网站的发展,越来越多的商品交易和买卖由线下搬到了线上,这里主要有三种角色,买家,买家和平台;平台为卖家提供信息发布和展示,为买家提供信息查询,获取自己需要的商品。常见的电子商务平台一般通过提供搜索服务给买家来找到其所需要的商品,一般是提供一个搜索引擎作为买家信息获取的工具,比如用户通过搜索“手机”,来查看在该电子商务平台上有哪些商品,哪些商家,从中找到满足自己需求的商品,完成交易,所以平台能够为买家和卖家、或类似关系的信息发布方和查找方建立信息沟通的桥梁。
但是,由于买卖家信息不匹配或者知识领域的不对称,有时会出现卖家表述自己信息的方式不符合买家搜索习惯,导致用户无法搜索到自己所需要的产品,有些产品不能够准确合理的展现给需要的用户,对卖家也是一种损失,损失一个目标客户。而试图通过让买家学习和了解卖家对商品的描述方式是不合理的,反之亦然。另外卖家作为生产或者代理服务提供方,在卖家推出新品或者新的服务的时候,往往买家还没有相关的经验或知识,所以导致这部分产品未能够合理有效的推送给买家,造成双方的沟通和衔接成本,造成双方损失。
为解决这样的问题,搜索引擎一般会通过扩展用户的查询词或者推荐来最大限度的降低由于买卖家信息不匹配带来的未满足问题;所以查询词扩展技术是一种解决买卖家信息不匹配很有效的一种手段,但是目前采用的手段都还是站在买家角度解决的,通过搜集网站平台买家的大量搜索日志行为,并以这些搜索日中用户曾经搜索过的查询词作为数据集合,通过聚类等一些方法扩展用户搜索词,这些词是购买类似产品的其他用户曾经使用过的搜索,这样的话可以在一定程度上解决部分买家搜索词片面的问题,提高信息匹配度,提高用户体验。
对于这样的方案存在的问题是,虽然考虑了一定规模的买家行为,可以部分的解决某一部分用户片面的搜索方式,但是这样方案存在的最大问题是片面性,信息扩展的丰富度和满足度不够,仅利用买家信息,也就是本网站特定客户群的搜索习惯用词,很难发觉新的搜索用词出现,不能够最大程度上解决信息不匹配问题;由于网站一般是通过用户搜索词的统计,再通过聚类关联等手段形成扩展词推荐列表,但是对于新出现的商品或者突然热门的商品就很难给出好的推荐结果;而且没法真正的解决买卖家信息不匹配问题,在专业知识不对称的情况下,卖家的描述方法有时和买家是不匹配的,这样导致部分卖家的信息和商品无法在搜索中很好的展现,影响网站买家用户及卖家用户体验和收益。其它发布方/查找方的情况也类似。
发明内容
本申请要解决的技术问题是如何提高发布方和查找方之间的信息匹配度。
为了解决上述问题,本申请提供了一种推荐搜索词的方法,包括:
对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;
将所述主题词与一个或多个描述词的组合作为搜索词;
由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;
根据所述发布方推荐度评价值从所述搜索词中选择推荐词。
进一步地,所述推荐搜索词的方法还包括:
根据用户的输入词得到多个与该输入词相关的搜索词;
对所述多个相关的搜索词根据所述发布方推荐度评价值进行排序或过滤。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
分别计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值;用所述时间段内搜索词数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210385554.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种报表自动更新的方法和装置
- 下一篇:基于数据库的视频摘要生成方法