[发明专利]多级数据存储方法及装置、多级数据结构、信息检索方法在审
申请号: | 201510745016.X | 申请日: | 2015-11-05 |
公开(公告)号: | CN105404660A | 公开(公告)日: | 2016-03-16 |
发明(设计)人: | 曾永梅;李波;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 吴敏 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多级 数据 存储 方法 装置 数据结构 信息 检索 | ||
技术领域
本发明涉及数据存储技术,特别涉及一种多级数据存储方法及装置、多级数据结构、信息检索方法。
背景技术
知识库,又称为智能数据库或人工智能数据库。知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
随着针对知识库的搜索引擎的应用,使得用户通过搜索引擎在知识库中准确而快速地检索到需要的信息。但是实际使用中,不同用户提出问题的角度不同或针对同一问题的问法不同,使得搜索引擎搜到的信息有限或者噪音较大,为了提高检索的效率和准确性,与知识库具有联系的词类库得以建立,词类库将某些同一种类或同一性质的词进行不同词级的管理和应用,进行搜索时,搜索引擎中输入的关键字与词类库中的词类名称进行匹配,快速而准确的判断知识库中是否存在相关信息。
但是现有技术建立的词类库的数据存储结构较为复杂,并且不能满足搜索的需求,信息检索的精度和效率有待提升。
发明内容
本发明解决的问题是怎样提高信息检索的精度和效率。
为解决上述问题,本发明提供一种多级数据存储方法,采用单个数据分类结构存储相互关联的多级数据;所述方法包括:
分别生成各级数据的数据标签及分别记录各数据标签对应的关联关系信息,并记录底层数据标签的语义内容,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系;
判断是否对各数据标签记录语义内容;
如果是,则对对应的数据标签记录语义内容。
可选的,判断是否对各数据标签记录语义内容的过程包括:判断数据标签是否为底层数据标签,若该数据标签不是底层数据标签,则判断该数据标签是否为单独词,若该数据标签为单独词,则进行对该数据标签记录语义内容的步骤。
可选的,判断数据标签是否为单独词的过程包括:提供字典,所述字典中存储有若干单独词;将数据标签与字典进行匹配,若匹配,则该数据标签为单独词。
可选的,所述多级数据存储方法还包括:采用不同方式标记记录有语义内容的数据标签以及未记录有语义内容的数据标签。
可选的,所述语义内容与对应的数据标签存储的位置相同。
可选的,所述语义内容为表达对应的数据标签的语义的词语集合。
可选的,所述多级数据存储方法还包括:当需要添加具有新的数据标签的数据时,在所述数据分类结构中增加该数据的数据标签,并对需要记录语义内容的数据标签记录语义内容;更新所述数据对应的上下级数据的关联关系信息。
可选的,所述多级数据存储方法还包括:当需要删除一数据标签下的所有数据时,在所述数据分类结构中删除该数据的数据标签、语义内容及关联关系信息;更新所述数据对应的上下级数据的关联关系信息。
本发明实施例还提供了一种由上述多级数据存储方法形成词类库的方法,其中,所述数据标签是词类标签;所述关联关系信息中保存上下级词类名称之间的关系;语义内容是表达所述词类标签语义的词语集合。
本发明实施例还提供了一种信息检索方法,所述方法包括:
从接收到的服务请求中确定关键词;
在所述数据分类结构的语义内容及关联关系信息中检索所述关键词,以得到与所述关键词对应的标准问;
在服务数据库中查询与所述标准问匹配的服务内容。
本发明还提供了一种多级数据结构,包括:多级数据标签以及各数据标签对应的关联关系信息;至少部分数据标签的语义内容。
可选的,所述语义内容与对应的数据标签存在相同的位置。
可选的,具有语义内容的数据标签位于底层或者为单独词。
本发明还提供了一种多级数据存储装置,包括:
数据标签生成单元,用于分别生成各级数据的数据标签;
关联关系信息记录单元,用于记录各数据标签对应的关联关系信息,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系;
判断单元,用于判断是否对各数据标签记录语义内容;
语义内容记录单元,用于对需要记录语义内容的数据标签记录语义内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510745016.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置