[发明专利]医疗文本的检索方法、电子设备及存储介质在审
| 申请号: | 201810039291.3 | 申请日: | 2018-01-16 |
| 公开(公告)号: | CN108256061A | 公开(公告)日: | 2018-07-06 |
| 发明(设计)人: | 胡琴敏;王月瑶 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;潘一诺 |
| 地址: | 200333 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 查询项 文本 存储介质 电子设备 医疗 检索 分类结果 优化 贝叶斯模型 伪相关反馈 文本数据库 查询扩展 文本检索 保留 分类 | ||
1.一种医疗文本的检索方法,其特征在于,包括如下步骤:
S110:获取包含病症描述的文本,将所述文本作为初始查询项;
S120:利用朴素贝叶斯模型对初始查询项进行分类,分类结果包括查询项缩减和查询项扩展;
S130:保留分类结果为查询项扩展的初始查询项,并作为中间查询项;
S140:对所述中间查询项进行查询扩展,将扩展后的中间查询项作为优化查询项;
S150:利用所述优化查询项在医疗文本数据库中进行文本检索。
2.如权利要求1所述的医疗文本的检索方法,其特征在于,所述步骤S120包括:
S121:对所述初始查询项进行向量化获得所述初始查询项的词向量;
S122:将初始查询项的词向量作为所述朴素贝叶斯模型的输入。
3.如权利要求2所述的医疗文本的检索方法,其特征在于,所述步骤S121基于共现矩阵的词向量模型对所述初始查询项进行向量化获得所述初始查询项的词向量。
4.如权利要求2所述的医疗文本的检索方法,其特征在于,所述朴素贝叶斯模型采用如下步骤进行训练:
将基于医疗文本的情感词典作为所述朴素贝叶斯模型的语料库;
获取语料库中的语料及语料标注;
对所述语料库中的语料进行向量化获得所述语料库中的语料的词向量;
将所述词向量作为所述朴素贝叶斯模型的输入;
根据将所述语料库中的语料对应的语料标注确定分类结果,并将所述分类结果作为所述朴素贝叶斯模型的输出;
训练所述朴素贝叶斯模型。
5.如权利要求4所述的医疗文本的检索方法,其特征在于,基于共现矩阵的词向量模型对所述语料库中的语料进行向量化获得所述语料库中的语料的词向量。
6.如权利要求4所述的医疗文本的检索方法,其特征在于,所述语料标注包括正面词和否定词,若所述语料标注为正面词,则所述分类结果为查询项扩展;若所述语料标注为否定词,则所述分类结果为查询项缩减。
7.如权利要求1所述的医疗文本的检索方法,其特征在于,所述S140包括:
将所述中间查询项与一扩展词库中的候选词进行相似度匹配;
将相似度最高的n个候选词作为所述中间查询项的扩展。
8.如权利要求7所述的医疗文本的检索方法,其特征在于,利用Bm25算法计算所述中间查询项与一扩展词库中的候选词的相似度。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至8任一项所述的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至8任一项所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810039291.3/1.html,转载请声明来源钻瓜专利网。





