[发明专利]医学短语匹配方法、装置、设备及存储介质有效
| 申请号: | 202011386028.5 | 申请日: | 2020-12-02 |
| 公开(公告)号: | CN112464662B | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 郭建福 | 申请(专利权)人: | 深圳平安医疗健康科技服务有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/166;G06F40/247 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518000 广东省深圳市福田区华*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 医学 短语 匹配 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能领域,公开了医学短语匹配方法、装置、设备及存储介质,应用于智慧医疗领域中,用于提高临床医学短语与标准医学短语之间的匹配效率。本发明方法包括:获取待识别短语,待识别短语包括多个医学实体;在预置的医学文本库中确定与待识别短语相关的标准医学短语集,标准医学短语集包括多个标准医学短语;将待识别短语与多个标准医学短语进行拼接,得到多个待识别医学语句;将多个待识别医学语句分别输入训练好的BERT模型中,生成多个待识别医学语句向量;根据多个待识别医学语句向量生成多个相似度;比较多个相似度的取值大小,确定取值最大的目标相似度,并根据目标相似度确定与待识别短语匹配的标准医学短语。
技术领域
本发明涉及医疗数据领域,尤其涉及一种医学短语匹配方法、装置、设备及存储介质。
背景技术
医学临床短文本标准化是医学统计中一项必要任务。临床上,关于同一种诊疗、手术、疾病等往往会有很多写法。标准化要解决的问题就是要为临床上各种不同说法找到对应的标准说法。
预训练自然语言模型已对几乎下游所有类型的自然语言处理任务(序列标注、分类、句子关系判断等)有明显的促进作用。现有业内主流使用深度学习模型的也大多采用类似的预训练自然语言模型来解决短文本标准化问题。
现有方案只能为部分临床医学短语匹配标准医学短语,不能覆盖到所有临床文本数据,导致匹配模型对临床医学短语的匹配效率低,在真实临床数据场景下的适应性弱。
发明内容
本发明提供了一种医学短语匹配方法、装置、设备及存储介质,用于提高临床医学短语与标准医学短语之间的匹配效率,提高匹配模型在真实临床数据场景下的适应性。
本发明实施例的第一方面提供一种医学短语匹配方法,包括:获取待识别短语,所述待识别短语包括多个医学实体;在预置的医学文本库中确定与所述待识别短语相关的标准医学短语集,所述标准医学短语集包括多个标准医学短语;将所述待识别短语与所述多个标准医学短语进行拼接,得到多个待识别医学语句;将所述多个待识别医学语句分别输入训练好的BERT模型中,生成多个待识别医学语句向量;根据所述多个待识别医学语句向量生成多个相似度;比较所述多个相似度的取值大小,确定取值最大的目标相似度,并根据所述目标相似度确定与所述待识别短语匹配的标准医学短语。
可选的,在本发明实施例第一方面的第一种实现方式中,所述在预置的医学文本库中确定与所述待识别短语相关的标准医学短语集,所述标准医学短语集包括多个标准医学短语,包括:确定所述待识别短语中每个医学实体对应的实体类型和所属的目标医学类别;在所述预置的医学文本库中抽取所述目标医学类别中全部候选医学词语,得到目标类别医学词语;在所述目标类别医学词语中选择与所述实体类型对应的待选择医学词语,确定多个标准医学短语,得到标准医学短语集。
可选的,在本发明实施例第一方面的第二种实现方式中,所述将所述待识别短语与所述多个标准医学短语进行拼接,得到多个待识别医学语句,包括:对所述多个标准医学短语中的标准医学短语进行排序,得到多个待拼接医学短语和对应的排列顺序;按照所述对应的排列顺序依次将所述多个待拼接医学短语与所述待识别短语进行连接,得到多个拼接的医学语句;在每个拼接的医学语句中加入起始符号和分隔符号,生成多个待识别医学语句。
可选的,在本发明实施例第一方面的第三种实现方式中,所述将所述多个待识别医学语句分别输入训练好的BERT模型中,生成多个待识别医学语句向量,包括:将所述多个待识别医学语句分别输入训练好的BERT模型的transformer层中,生成多个待处理医学语句向量;通过所述训练好的BERT模型的池化层对所述多个待识别医学语句进行实体识别,得到多个字向量;将所述多个字向量分别与每个待处理医学语句向量进行求和并取均值,生成多个待识别医学语句向量。
可选的,在本发明实施例第一方面的第四种实现方式中,在所述获取待识别短语,所述待识别短语包括多个医学实体之前,所述医学短语匹配方法还包括:对初始改进的BERT模型进行训练,得到训练好的BERT模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳平安医疗健康科技服务有限公司,未经深圳平安医疗健康科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011386028.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多层预制基板及其压合工艺
- 下一篇:一种基于同轴线缆的5G信号传输系统





