[发明专利]一种数据查询方法及装置在审
申请号: | 201611032930.0 | 申请日: | 2016-11-15 |
公开(公告)号: | CN108073655A | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 陈海涛;王明方 | 申请(专利权)人: | 南京途牛科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 冯倩 |
地址: | 210000 江苏省南京市玄*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 查询 汉字识别 数据查询 预存 排序 数据库 计算机信息检索 优先级顺序 查询结果 接收用户 有效查询 汉字表 预设 | ||
本发明实施例提供了一种数据查询方法及装置,属于计算机信息检索技术领域。该方法包括:接收用户输入的需要查询的简称,其中,所述简称包含至少两个汉字。对所述简称进行汉字拆分,得到多个独立的汉字,查询预存的汉字表得到与每个汉字对应的汉字识别号。根据所述多个独立的汉字分别对应的汉字识别号在预存的数据库中进行查询,得到该数据库中至少包含所述简称中的两个独立的汉字的全称。将所述查询得到的全称进行排序得到查询结果。本发明能够根据输入的简称有效查询出包含该简称中至少两个汉字的全称,并对查询出的全称按照预设的优先级顺序进行排序。
技术领域
本发明涉及计算机信息检索技术领域,具体而言,涉及一种数据查询方法及装置。
背景技术
信息检索系统已经发展到网络化和智能化的阶段。信息检索的对象已经从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新更快、分布广泛以及管理松散的网页内容。信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,这对信息检索从结果到方式提出了更高、更多样化的要求。现有与信息检索系统相关的技术主要包含:网络蜘蛛、中文分词、索引库、网页摘要的提取、网页相似度和信息的分类等。
发明人在研究中发现,目前功能性模糊查询往往都是基于数据库模糊查询的,主要利用like或者RegExp模式对输入的整个字符串进行模糊匹配,这仅能满足一定的需求,并且性能较差,但是对于特定需求,例如根据简称查询全称的这种模糊搜索,则不能胜任。
发明内容
本发明提供了一种数据查询方法及装置,旨在能够根据简称有效查询出包含简称中汉字的全称,并对查询出的全称按照预设的优先级顺序进行排序。
第一方面,本发明实施例提供了一种数据查询方法,该方法包括:
接收用户输入的需要查询的简称,其中,所述简称包含至少两个汉字;
对所述简称进行汉字拆分,得到多个独立的汉字,查询预存的汉字表得到与每个汉字对应的汉字识别号;
根据所述多个独立的汉字分别对应的汉字识别号在预存的数据库中进行查询,得到该数据库中至少包含所述简称中的两个独立的汉字的全称;
将所述查询得到的全称进行排序得到查询结果。
优选地,所述数据库中存储有简称-汉字关联表和全称表;
所述根据所述多个独立的汉字分别对应的汉字识别号在预存的数据库中进行查询,得到该数据库中至少包含所述简称中的两个独立的汉字的全称的步骤包括:
根据所述多个独立的汉字分别对应的汉字识别号在所述简称-汉字关联表中进行关联查询,对查询结果进行去重后得到至少一个简称识别号;
根据所述至少一个简称识别号查询预存的全称表得到与每个简称识别号相对应的全称。
优选地,当所述简称中包含两个汉字时,所述将所述查询得到的全称进行排序得到查询结果的步骤,包括:
确定所述全称与所述简称的包含关系,其中,所述包含关系包括连字全包含和分字全包含,所述连字全包含为所述全称包含所述简称中的全部汉字且该全部汉字在所述全称中是连续的,分字全包含为所述全称包含所述简称中的全部汉字但该全部汉字在所述全称中是非连续的;
将与所述连字全包含对应的全称排在所述分字全包含对应的全称前面。
优选地,当所述简称中包含两个以上的汉字时,所述将所述查询得到的全称进行排序得到查询结果的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京途牛科技有限公司,未经南京途牛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611032930.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种市场调研用网络浏览登入技术
- 下一篇:多属性移动对象3D显示