[发明专利]一种用于司法行政信息数据的Hbase联合检索索引方法在审
| 申请号: | 201911098790.0 | 申请日: | 2019-11-11 |
| 公开(公告)号: | CN110909113A | 公开(公告)日: | 2020-03-24 |
| 发明(设计)人: | 高昊飞;王春华;杨鹏举;刘沛珑 | 申请(专利权)人: | 北京航天长峰股份有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
| 代理公司: | 苏州拓云知识产权代理事务所(普通合伙) 32344 | 代理人: | 王云峰 |
| 地址: | 100854 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 司法 行政 信息 数据 hbase 联合 检索 索引 方法 | ||
本发明公开了一种用于司法行政信息数据的Hbase联合检索索引方法,该方法包括以下步骤:步骤一:建立初始文档;步骤二:对文字进行具体分析;步骤三:将文档计入索引列表。
技术领域
该发明直接应用的技术领域为司法行政资源的大数据信息检索索引。
背景技术
随着司法改革的不断深化和社会经济的不断发展,司法行政也面临着许多新情况、新问题。依托司法行政资源决策技术,推进信息化条件下业务流程再造,以信息化建设推进工作机制完善,推动实现了信息主导、精准服务、精准管控、智能研判的工作新模式,构建起以“智慧决策观”“智慧服务观”“智慧组织结构观”为重点的司法行政“智慧法务”新格局,对司法行政工作向标准化、规范化、精细化方向延伸具有重要推动作用。
当今时代下,大数据已经成为了一种趋势,对我们的工作、生活都有着巨大的影响。在当下的大数据环境下,分布式文件系统、分布式存储系统、分布式计算等都是核心的大数据技术。Hbase技术来源于Fay Chang所撰写的Google论文,“Bigtable”关于一个结构化数据的“分布式存储系统”。是和Hadoop分布式文件系统对应的一个分布式数据库的概念。具体地,Hbase是一个分布式、面向列开源数据库。而且也不同于一般的关系数据库,Hbase是一个适合于非结构化数据存储的数据库。进一步地,Hbase是基于列的而非基于行的模式,这就与传统型数据库呈现出显著差别,是建立在HDFS上的分布式列存储系统。
HBase的索引机制使其在针对指定行键的单点查询和范围查询时能得到很好的响应速度,但在进行非主键查询时,HBase需要对全表进行扫描,耗时较长,查询效率低下,无法满足需要高速响应的数据检索和统计分析要求。为解决现有HBase对检索支持不足的缺陷,引入检索支持良好的Elastic Search从而设计一种联合检索策略。
发明内容
为实现上述目的,本发明提供如下技术方案:一种用于司法行政信息数据的Hbase联合检索索引方法,该方法包括以下步骤:
步骤一:建立初始文档;
步骤二:对文字进行具体分析;
步骤三:将文档计入索引列表。
作为本发明的一种优选技术方案,在对司法行政资源信息进行检索操作之前,需要对文档中具体内容进分词,为其创建一个无重复词出现的有序单词列表,ElasticSearch对文本进行分析并将其构建成为倒排索引。
作为本发明的一种优选技术方案,步骤一:建立初始文档,包括严格按照设置的mappings格式对获取的数据进行文档建立,获取的具有检索需求的司法行政数据转换成为文字的形式,文档的组织形式是一系列的键值对,值的形式符合特定映射字段的需要。
作为本发明的一种优选技术方案,步骤二:对文字进行具体分析,包括进行文档分析操作将文本分割成一系列被称为标记的独立原子元素,该过程包括了对文档进行字符过滤处理、分词器分词和字符过滤处理一系列操作。
作为本发明的一种优选技术方案,步骤三:将文档加入索引列表,包括:将完成分析的索引文档加入到Elastic Search的索引列表。
与现有技术相比,本发明提供了一种用于司法行政信息数据的Hbase联合检索索引方法,具备以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长峰股份有限公司,未经北京航天长峰股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911098790.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电解法次氯酸钠发生器系统及运行方法
- 下一篇:监督驱动电路
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





