[发明专利]一种搜索方法和系统有效
申请号: | 201210018149.3 | 申请日: | 2012-01-19 |
公开(公告)号: | CN103218364A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 李嘉森 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 系统 | ||
技术领域
本申请涉及网络技术领域,特别是涉及一种搜索方法和系统。
背景技术
一种产品或者商品通常都会有一个品牌。比如运动鞋这种商品,有阿迪达斯品牌的运动鞋,有耐克品牌的运动鞋,有李宁品牌的运动鞋。对于商品的品质来说,品牌无疑是最有力的证据,是服务的保证。随着网络技术的发展,越来越多的用户在网上购买商品,由于缺乏现场体验的环节,所以商品的品牌信息对商品的品质更是尤为重要,因此在电子商务中,系统根据用户的搜索词返回准确的品牌信息显得尤为重要。
现有技术中,一种方法是只对商品的标题进行关键词匹配,这样可能产出非用户期望的品牌商品,如搜索阿迪达斯,搜索结果只会给出商品标题中含有阿迪达斯、阿迪、adidas等不同形式关键字的商品,但有可能这个商品的品牌属性却不是阿迪达斯品牌。此外,对于本身是阿迪达斯品牌的商品,但因标题中没有出现阿迪达斯相关的品牌关键词,而容易在搜索排序时漏掉。
另一种方法是建立两个单独的引擎,一个是商品的标题引擎,一个是品牌信息引擎,在对用户的搜索词进行分词后,将分词后的查询词分别在标题引擎和品牌信息引擎中进行匹配运算,然后再将两个引擎的计算结果结合起来计算整体的相关度。但假如商品的标题和品牌均被重新编辑了,需要同时增量更新2个引擎的索引,即使只修改了标题或者品牌信息的一个,也需要同时更新2个引擎,这不但需要增加较多的额外计算成本,并且对于在每个引擎中以无定位方式存储商品,那么更新引擎索引时计算成本更加庞大,因此,这种方法处理缓慢,维护成本比较高,硬件成本也比较高,并且不利于快速更新。
发明内容
本申请所要解决的技术问题是提供一种搜索方法和系统,能快速处理返回结果,方便维护,维护成本低。
为了解决上述问题,本申请公开了一种搜索方法,包括:
对于用户输入的搜索词,获取所述搜索词对应的各查询词;
针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段;
依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区;
根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算的第一相关度;
基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。
优选的,所述通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段,包括以下步骤:
读取目标对象的标题信息字段区和属性信息字段区;
用空白字符替换所述新字段中与第一分隔符相同的字符;
将替换后的标题信息字段区和属性信息字段区通过第一分隔符拼接为一个新字段。
优选的,根据所述字段中的各分词构建索引通过以下步骤进行:
将各目标对象的标识通过第二分隔符与相应的新字段进行对应;
对各新字段进行分词操作;
以分词操作得到的分词作为索引词,将索引词与相关各目标对象的标识和该索引词在各新字段中位置进行对应。
优选的,通过以下步骤确认所述查询词是属于标题信息字段区或者是属于属性信息字段区:
根据所述索引词与相关各目标对象的标识的对应关系,查询与标识相应的新字段;
将所述索引词在所述新字段中的位置与第一分隔符在所述新字段中的位置进行比较,确认所述索引词对应的查询词是属于标题信息字段区或者是属于属性信息字段区。
优选的,通过以下步骤获得所述第一相关度:
将各查询词字符串长度除以所在字段区字符串长度,获得各查询词与所在字段区的区间相关度;
将各相关度乘以所在字段区的权重并相加,得到搜索词与新字段的第一相关度。
优选的,所述的搜索词包括:
将用户的输入的关键词作为搜索词;
或者,将用户选择的根据该用户的输入词返回的建议词中的一个作为搜索词;其中,所述的建议词通过预先统计的用户输入的输入词与对应结果的点击关系提取获得。
优选的,对于用户输入的搜索词,获取所述搜索词的查询词时包括:
通过智能纠错引擎对于用户错误输入的搜索词进行纠错。
优选的,所述的目标对象包括商品;所述的属性信息包括商品的品牌信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210018149.3/2.html,转载请声明来源钻瓜专利网。