[发明专利]一种可信的病历结构化方法及系统有效
申请号: | 201610248043.0 | 申请日: | 2016-04-20 |
公开(公告)号: | CN105956362B | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 林学仁;蒋永 | 申请(专利权)人: | 上海爱楷医疗科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F17/30 |
代理公司: | 苏州慧通知识产权代理事务所(普通合伙) 32239 | 代理人: | 丁秀华 |
地址: | 201400 上海市奉贤区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种可信的病历结构化方法及系统,该方法包括建立特征词数据集并赋予修饰词可信度,建立特征词关联图表,对描述语句进行分词并计算语句中每个特征名词的可信度,最后进行人工训练,得到描述语句的结构化表示。相比现有技术,本发明更适合计算机处理,大大提高了效率,同时通过标识数据可信度,使得结构化数据更容易做进一步处理。 | ||
搜索关键词: | 一种 可信 病历 结构 方法 系统 | ||
【主权项】:
1.一种可信的病历结构化方法,其特征在于,该方法包括如下步骤:(1)定义特征词数据集并保存于数据库中,所述特征词数据中的每个特征词具有类别,所述类别包括:特征名词、修饰词;(2)为所述特征词数据集中的每个修饰词分别赋予一个缺省可信度,所述缺省可信度是一个0到1之间的数值;(3)建立特征词关联表,所述特征词关联表用于记录特征词数据集中每个特征名词与修饰词的关联可信度,所述关联可信度的初始值为相应修饰词的缺省可信度;(4)对于病历中的每一个描述语句,基于特征词数据集进行分词,得到特征词序列集合,对于该集合中的任意一个特征名词A0,获取A0和前一个特征名词或标点符号之间的修饰词,同时获取A0和后一个特征名词或标点符号之间的修饰词,设这些修饰词共有n个,分别为B1,B2,……,Bn,根据特征词关联表获取A0与Bi的关联可信度βi,1≤i≤n,通过下述公式计算该描述语句中该特征名词A0的可信度β,即:
(5)人工训练步骤,即如果一个描述语句中有一个特征名词的可信度大于0且小于1,则对该描述语句的可信度计算结果进行人工干预审核;然后将该描述语句中的每个特征名词和相应可信度组合构成该描述语句的结构化数据;(6)基于人工干预审核的结果,对特征词数据集和特征词关联表进行更新或修改。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海爱楷医疗科技有限公司,未经上海爱楷医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610248043.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种新型消化内镜支架
- 下一篇:骨科外固定支架调节杆