[发明专利]疾病蕴含训练集的构造方法及装置有效
| 申请号: | 202010215876.3 | 申请日: | 2020-03-24 |
| 公开(公告)号: | CN111599478B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 任禾 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H70/00 |
| 代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 陈国军 |
| 地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 疾病 蕴含 训练 构造 方法 装置 | ||
本发明提供了疾病蕴含训练集的构造方法,包括:基于预先存储的疾病数据集,建立疾病知识树结构;基于建立的疾病知识树结构,构造相应的蕴含关系和不蕴含关系;根据所述蕴含关系和不蕴含关系,构造疾病蕴含训练集。通过对疾病知识树结构进行加工处理得到蕴含和不蕴含关系,并实现自动构造疾病蕴含数据集的目的,其速度快,可大大减少人工的工作量。
技术领域
本发明涉及医疗疾病技术领域,特别涉及疾病蕴含训练集的构造方法及装置。
背景技术
疾病蕴含关系对分析疾病之间的关系十分重要,一般对疾病蕴含关系是采用单纯的人工进行构建的,但是人工构建不仅需要大量的专业知识,还需要大量的专业人员对目前10万量级的疾病术语进行人工标注,工作量很大,耗时耗力,而且,还可能存在人为疏忽,导致构造的疾病蕴含关系不合理,因此智能化构造疾病蕴含训练集就显得尤为重要。
发明内容
本发明提供疾病蕴含训练集的构造方法及装置,用以通过对疾病知识树结构进行加工处理得到蕴含和不蕴含关系,并实现自动构造疾病蕴含数据集的目的,其速度快,可大大减少人工的工作量。
本发明提供疾病蕴含训练集的构造方法,包括:
步骤S1:基于预先存储的疾病数据集,建立疾病知识树结构;
步骤S2:基于建立的疾病知识树结构,构造相应的蕴含关系和不蕴含关系;
步骤S3:根据所述蕴含关系和不蕴含关系,构造疾病蕴含训练集。
在一种可能实现的方式中,在执行所述步骤S1之后,且在执行所述步骤S2之前,包括:
步骤S11:获取所述疾病知识树结构中的第一节点对应的第一预设词汇;
步骤S12:确定所获取的所述第一预设词汇对应的祖先节点的第二预设词汇;
步骤S13:判断所述第一预设词汇是否与所述第二预设词汇相同,若是,保留所述第二预设词汇对应的祖先节点,并消除第一预设词汇对应的第一节点;否则,不执行任何操作。
在一种可能实现的方式中,在执行所述步骤S13之后,且在执行所述步骤S2之前,还包括:
步骤S131:获取所述疾病知识树结构中的第三预设词汇对应的待消除节点;
步骤S132:确定所有所述第三预设词汇在所述疾病知识树结构中的位置权重;
步骤S133:根据所确定的位置权重结果,获取第三预设词汇的最大位置权重;
步骤S134:根据所获取的最大位置权重,保留所述最大位置权重对应的待消除节点,同时消除其余待消除节点。
在一种可能实现的方式中,在执行所述步骤S134之后,且在执行所述步骤S2之前,还包括:
步骤1341:在所述步骤S134的基础上获取所述疾病知识树结构中的剩余节点,确定所述剩余节点中的每个非叶子节点的节点长度,并将节点长度大于预设长度、且符合疾病命名规则的非叶子节点标记为描述性节点,其余非叶子节点标记为非描述性节点,其中,所述描述性节点不作为构造疾病蕴含训练集的候选节点;
步骤S1342:获取所述疾病知识树结构中的叶子节点,根据所述叶子节点和与所述叶子节点相关的非描述性节点,构造节点蕴含关系规则;
同时,根据所述剩余节点,构造新的疾病知识树结构。
在一种可能实现的方式中,在执行所述步骤S2的过程中,根据所述新的疾病知识树结构,构造相应的蕴含关系,其步骤包括:
步骤S21:获取所述新的疾病知识树结构中的叶子节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010215876.3/2.html,转载请声明来源钻瓜专利网。





