[发明专利]一种基于语义相似性的手术操作编码方法在审
| 申请号: | 201910953758.X | 申请日: | 2019-10-09 |
| 公开(公告)号: | CN110767296A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 张宪录;程岚;祝伟 | 申请(专利权)人: | 北京雅丁信息技术有限公司 |
| 主分类号: | G16H40/20 | 分类号: | G16H40/20 |
| 代理公司: | 11487 北京中企鸿阳知识产权代理事务所(普通合伙) | 代理人: | 庞晓辰 |
| 地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 手术操作 非标准 标准库 词向量 神经网络构建 语义相似性 分词处理 分词结果 向量计算 训练参数 训练模型 准确度 计算量 停用词 阈值时 映射 构建 向量 词语 剔除 统一 | ||
1.一种基于语义相似性的手术操作编码方法,其特征在于,包括以下步骤:
S1、提取不同ICD版本的手术操作编码及其对应的手术操作描述,构建标准库,从病案首页或医嘱数据中提取手术操作描述,构建非标准库;
S2、剔除标准的手术操作描述和非标准的手术操作描述中的停用词,并利用结巴分词工具为处理后的手术操作描述进行分词处理;
S3、基于神经网络构建训练模型,所述训练模块根据S2的分词结果和设置的训练参数获得每个词语的词向量;
S4、根据词向量分别计算标准的手术操作描述和非标准的手术操作描述的句向量;
S5、根据句向量计算非标准的手术操作描述到标准的手术操作描述的相似性得分;
S6、确定ICD版本,当非标准的手术操作描述与该版本下某一标准的手术操作描述的相似性得分高于相似阈值时,将该非标准手术操作描述映射到该标准手术操作描述的编码上。
2.根据权利要求1所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述ICD版本包括ICD9、ICD11。
3.根据权利要求1所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述停用词包括标点符号和助词。
4.根据权利要求1所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述步骤S3中的训练模型选用Word2Vec模型。
5.根据权利要求1所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述步骤S3中的训练参数包括词向量长度、窗口长度、最小词频和负样本数量。
6.根据权利要求5所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述词向量长度的取值范围为90~120,所述窗口长度的取值范围为3~7,所述最小词频的取值范围为3~7,所述负样本数量的取值范围为2~4。
7.根据权利要求1所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述步骤S4中标准的手术操作描述的句向量的计算公式如下:
其中,sen_vecjk表示标准库中第k个版本下第j个手术操作描述的句向量,mjk为第j个手术操作描述的词语个数,w_vecijk表示第k个版本下第j个手术操作描述中第i个词语的词向量,k=1,2,…,a,j=1,2,…,b,标准库中共有a个版本,一个版本下共有b个手术操作描述;
非标准的手术操作描述的句向量的计算公式如下:
其中,sen_vecj'表示非标准库中第j'个手术操作描述的句向量,mj'为第j'个手术操作描述的词语个数,w_vecij'表示第j'个手术操作描述中第i个词语的词向量,j'=1,2,…,c,非标准库中共有c个手术操作描述。
8.根据权利要求7所述的一种基于语义相似性的手术操作编码方法,其特征在于,步骤S5中的相似性得分的计算公式如下:
其中,simj',jk表示非标准库中第j'个手术操作描述到标准库中第k个版本下第j个手术操作描述的相似性得分。
9.根据权利要求1所述的一种基于语义相似性的手术操作编码方法,其特征在于,所述相似阈值的取值范围为0.6~0.85。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雅丁信息技术有限公司,未经北京雅丁信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910953758.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于无线网络的医院管理系统
- 下一篇:开放式手术室管理系统





