[发明专利]一种中文电子病历识别中否定域判定方法在审
| 申请号: | 202210102358.X | 申请日: | 2022-01-27 |
| 公开(公告)号: | CN114613460A | 公开(公告)日: | 2022-06-10 |
| 发明(设计)人: | 张少伟;蒋艳凰;余硕军;万斌;彭厘旻;康佳琪;雷鹏;杨淼 | 申请(专利权)人: | 人和未来生物科技(长沙)有限公司 |
| 主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/20;G06F40/289;G06F40/295;G06F40/30;G06N3/04 |
| 代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 邹大坚 |
| 地址: | 410000 湖南省长沙市长沙高*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 中文 电子 病历 识别 否定 判定 方法 | ||
1.一种中文电子病历识别中否定域判定方法,其特征在于,包括:
对中文病历进行分句处理;
利用规则集合对病历分句结果进行处理,删除与症状无关的分句结果;
利用深度神经网络识别规则集无法判定的否定域;
剩下与疾病症状相关的异常症状描述的病历语句,用于后续疾病表型获取。
2.根据权利要求1所述的中文电子病历识别中否定域判定方法,其特征在于,在对中文病历进行分句处理时,以[,,!!??;;.。]作为句子边界的标志,按照上述标点符号对段落进行分句。
3.根据权利要求2所述的中文电子病历识别中否定域判定方法,其特征在于,对分句结果进行否定域判定,按照语句特点分为两类:
有明显的否定词,否定域结构固定,使用规则进行精准识别;
不包含否定词,采用深度神经网络模型结合语义进行识别。
4.根据权利要求3所述的中文电子病历识别中否定域判定方法,其特征在于,采用深度神经网络模型结合语义进行识别包括基于规则的否定域识别:用于判定具有明显特征的否定域,依次使用两种规则集实现否定域的识别,一种是候选否定域规则集,一种异常规则集;候选否定域规则集,用于匹配有明确特征,病历分句如果被候选否定域规则集中某一规则匹配,则表明该病历分句明确符合否定域的组成特点,使用异常规则集判定该分句是否为真正的否定域。
5.根据权利要求4所述的中文电子病历识别中否定域判定方法,其特征在于,采用深度神经网络模型结合语义进行识别包括异常规则集,用于识别字符在句法上符合否定域的组成特点,描述的是患者异常症状,要进行保留;异常规则集是对候选规则集的补充,用于识别包含否定词但实际是描述患者异常表型的语句。
6.根据权利要求3所述的中文电子病历识别中否定域判定方法,其特征在于,采用深度神经网络模型结合语义进行识别包括基因深度学习的否定域识别:除了带有上述否定词的否定域,还有较多的否定域无法通过上述规则集判定,包括:(1)否定域是“无+症状”的模式;(2)不带否定词的否定域;(3)否定词不足以判断其是否为否定域。
7.根据权利要求1-6中任意一项所述的中文电子病历识别中否定域判定方法,其特征在于,采用BIO标注法作为语料的标注方法,其中B代表目标实体的起始字符;I代表目标实体词中的字符,包含实体词末尾位置;O代表不在目标实体中的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人和未来生物科技(长沙)有限公司,未经人和未来生物科技(长沙)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210102358.X/1.html,转载请声明来源钻瓜专利网。





