[发明专利]疾病数据映射方法、装置、计算机设备和存储介质在审
申请号: | 201811051911.1 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109448860A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 胡帆;胡雪莹 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16H70/00 | 分类号: | G16H70/00;G16H10/60;G06F16/36;G06F17/27;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王宁 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子节点 疾病数据 分词结果 映射 匹配 根节点 词语 计算机设备 存储介质 匹配结果 匹配路径 人工智能技术 获取目标 匹配树 分词 森林 申请 | ||
1.一种疾病数据映射方法,所述方法包括:
获取待映射的疾病数据,对所述待映射的疾病数据进行分词,得到分词结果;
将所述分词结果中的词语与匹配森林中每一个匹配树的根节点进行匹配,根据根节点匹配结果选取目标根节点作为当前节点;
当所述当前节点存在对应的下一级子节点时,将所述分词结果中的词语与所述下一级子节点进行匹配;
根据子节点匹配结果选取目标子节点作为当前节点,并进入当所述当前节点存在对应的下一级子节点时,将所述分词结果中的词语与所述下一级子节点进行匹配的步骤;
当所述当前节点不存在对应的下一级子节点时,确定所述当前节点所在的匹配路径,根据所述匹配路径获取目标疾病数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述分词结果中的词语与匹配森林中每一个匹配树的根节点进行匹配之前,包括:
对预先确定的基表库中每一个疾病数据进行分词,根据每一个所述疾病数据对应的分词结果得到词语集合,并获取所述词语集合中每一个词语所属的词语类型;
从所述词语集合中提取词语类型为第一预设类型的多个词语分别作为匹配树的根节点;
根据所述根节点生成多棵匹配树,得到匹配森林。
3.根据权利要求1所述的方法,其特征在于,所述根据所述根节点生成多个匹配树,得到匹配森林,包括:
从所述词语集合中提取词语类型为第二预设类型的词语,得到第一子集合;
从所述第一子集合中提取所述根节点对应的共现词,得到所述匹配树对应的当前叶子节点集合;
从所述词语集合中提取词语类型为第三预设类型的词语,得到第二子集合;
从所述第二子集合中提取当前叶子节点集合的共现词,以更新所述匹配树对应的当前叶子节点集合;
从所述词语集合中提取词语类型为第四预设类型的词语,得到第三子集合;
从所述第三子集合中提取更新后的当前叶子节点集合的共现词,根据更新后的当前叶子节点集合的共现词得到所述匹配树对应的目标叶子节点集合,生成匹配树。
4.根据权利要求1所述的方法,其特征在于,所述根据更新后的当前叶子节点集合的共现词得到所述匹配树对应的目标叶子节点集合,生成匹配树之后,包括:
确定所述匹配树上每一个所述目标叶子节点所在的匹配路径对应的疾病数据,将所述匹配路径与其对应的疾病数据建立映射关系。
5.根据权利要求3所述的方法,其特征在于,所述从所述第一子集合中提取所述根节点对应的共现词,包括:
获取每一个所述根节点对应的所有疾病数据的编码,得到每一个所述根节点对应的第一编码集合;
获取所述第一子集合中每一个词语对应的所有疾病数据的编码,得到所述第一子集合中每一个词语对应的第二编码集合;
当所述根节点对应的第一编码集合与所述词语对应的第二编码集合存在交集时,确定所述词语为所述根节点对应的共现词。
6.根据权利要求1至5任意一项所述的方法,其特征在于,将所述分词结果中的词语与匹配森林中每一个匹配树的根节点进行匹配,根据根节点匹配结果选取目标根节点作为当前节点,包括:
当所述分词结果中的词语与任意一个所述根节点都不匹配时,从预先建立的同义词库中查找每一个所述根节点对应的同义词;
将所述分词结果中的词语与所述同义词进行匹配,根据同义词匹配结果选取目标根节点作为当前节点。
7.根据权利要求1至5任意一项所述的方法,其特征在于,将所述分词结果中的词语与匹配森林中每一个匹配树的根节点进行匹配,根据根节点匹配结果选取目标根节点作为当前节点,包括:
当存在多个匹配成功的根节点时且所述多个匹配成功的根节点存在互斥关系时,从预先建立的互斥词库中获取每一个根节点对应的互斥权重,将权重较大的根节点作为目标根节点;
当存在多个匹配成功的根节点时且所述多个匹配成功的根节点不存在互斥关系时,则将所述多个匹配成功的根节点作为目标根节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811051911.1/1.html,转载请声明来源钻瓜专利网。