[发明专利]统计方法及装置有效
| 申请号: | 201410123667.0 | 申请日: | 2014-03-28 |
| 公开(公告)号: | CN104951467B | 公开(公告)日: | 2019-04-30 |
| 发明(设计)人: | 熊水林 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
| 代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 倪志华 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 字段 统计 统计信息 目标对象 分组 过滤条件 申请 | ||
本申请提供一种统计方法及装置。本申请实施例通过获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两个分组字段,进而根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值,以及根据所述至少两个分组字段的值,获得所述每个目标对象的组合字段的值,使得能够根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值,实现了对多个指定域的组合进行统计操作,从而提高了SOLR的统计灵活性。
【技术领域】
本申请涉及统计技术,尤其涉及一种统计方法及装置。
【背景技术】
SOLR是一个开源的搜索引擎,不仅提供了比Lucene更好的全文搜索服务,还可以作为海量数据的统计工具。SOLR的底层数据结构,仍然是Lucene的列式文件存储,各个列值在文件中是以数组或链表的形式存在。SOLR的统计组件(StatsComponent)可以分别对这些文件的多个指定域即分组,进行统计操作。
然而,SOLR的统计组件只能对每个指定域单独的进行统计操作,无法对多个指定域的组合进行统计操作,从而导致了SOLR的统计灵活性的降低。
【发明内容】
本申请的多个方面提供一种统计方法及装置,用以提高SOLR的统计灵活性。
本申请的一方面,提供一种统计方法,应用于SOLR中,包括:
获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两个分组字段;
根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值;
根据所述至少两个分组字段的值,获得所述每个目标对象的组合字段的值;
根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值,包括:
根据所述过滤条件,执行查询流程,以获得所述目标对象;其中,所述查询流程包括过滤操作;
根据所述统计字段和所述至少两个分组字段,获得所述目标对象的统计字段的值和至少两个分组字段的值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述查询流程还包括评分操作和排序操作。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述统计信息中还包括所述统计操作的操作标识;所述根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值,包括:
根据每个组合字段的值和所述操作标识,对所述每个目标对象的统计字段的值进行所述统计操作,以获得所述每个组合字段的值所对应的统计值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值之后,还包括:
根据所述每个组合字段的值,获得所述至少两个分组字段的值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值之后,还包括:
对每个统计值进行所述统计操作,获得统计汇总值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410123667.0/2.html,转载请声明来源钻瓜专利网。





