[发明专利]一种基于人工智能的医学影像报告质控系统、方法及介质在审
| 申请号: | 202011327695.6 | 申请日: | 2020-11-24 |
| 公开(公告)号: | CN112420148A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 彭焕;李彬;尹绍彬 | 申请(专利权)人: | 北京一脉阳光医学信息技术有限公司 |
| 主分类号: | G16H15/00 | 分类号: | G16H15/00;G06F40/216;G06K9/62;G06N3/04;G06N3/08;G06N7/00 |
| 代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 刘娟 |
| 地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 人工智能 医学影像 报告 系统 方法 介质 | ||
1.一种基于人工智能的医学影像报告质控系统,其特征在于,包括:报告获取与语料制作模块、检错模型构建模块、检错模块、纠错模型构建模块、纠错模块和提醒模块,
所述报告获取与语料制作模块用于按预设规则,批量抽样各类原始医学影像报告,进行特征分析整合、数据处理并制作报告语料库;
所述检错模型构建模块用于预先搭建多个并行检错模型,将处理后的报告语料库输入各个检错模型中训练模型,学习影像报告规律,得到训练好的检错模型;
所述检错模块用于将待质检的影像报告进行数据处理,送入各个训练好的检错模型,预测得到检错结果,输出综合错词候选词;
所述纠错模型构建模块用于在检错模型中加入纠错算法,训练得到多个纠错模型;
所述纠错模块用于将待质检的报告输入训练好的各个纠错模型,输出综合错词集与对应的纠错候选词;
所述提醒模块用于给出症状词、方位词、以及内容冲突词的提醒信息。
2.如权利要求1所述的系统,其特征在于,所述检错模型包括神经网络模型、统计语言模型、分词低频词模型和自定义错词集。
3.如权利要求2所述的系统,其特征在于,所述神经网络模型包括第一数据处理单元、模型训练单元和第一预测单元;
所述第一数据处理单元用于对各类医学影像报告或待质检医学影像报告进行处理,把医学影像报告数据按纵向分类、横向分类和不同时段提取数据,分层随机抽取原始语料数据;
对抽取的原始语料数据中的高频词、低频词、停用词、长尾数据进行处理;
将检查多类的报告按检查类别拆分;
对拆分好的检查单句以标点分行标注起始标记;
对标记后的数据进行分词和词映射ID编号处理;
将汉字转数学向量表示;
所述模型训练单元用于将处理后各类医学影像报告数据以句子为整体错位一个字后得到的新句子整体做预测结果的方式输入双向循环长短时记忆神经网络模型序列预测模型中训练,学习规律,得到正常句子组合的得分语言模型;
所述第一预测单元用于将处理后的待质检医学影像报告输入得分语言模型中查询,生成预测句子得分,根据平均绝对离差、标准差和概率均值得出概率得分,检出异常得分词。
4.如权利要求2所述的系统,其特征在于,所述统计语言模型包括第二数据处理单元、建模单元和第二检错单元,
所述第二数据处理单元用于对各类医学影像报告或待质检医学影像报告进行处理,制作统计语言模型语料;
所述建模单元用于将处理后的各类医学影像报告数据输入bi-gram模型训练学习规律,统计词组合概率,生成语言模型;
所述第二检错单元用于将处理后的待质检医学影像报告输入语言模型中查询,生成预测句子得分,根据平均绝对离差、标准差和概率均值得出概率得分,检出异常得分词。
5.如权利要求2所述的系统,其特征在于,所述分词低频词模型包括词典建立单元和第三检错单元,
所述词典建立单元用于对各类医学影像报告进行分词、统计词频处理,生成语料词典;
所述第三检错单元用于对待质检医学影像报告进行分词,将分词后的数据输入到语料词典中筛查低频词,得到候选错词集。
6.如权利要求2所述的系统,其特征在于,所述自定义错词集包括易错词收集单元、定期补充单元和批量打补丁单元,
所述易错词收集单元用于收集用户输入的易错词;
所述定期补充单元用于将收集的易错词定期补回到自定义错词表中;
所述批量打补丁单元用于将自定义错词表中的词批量更新到自定义错词集中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一脉阳光医学信息技术有限公司,未经北京一脉阳光医学信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011327695.6/1.html,转载请声明来源钻瓜专利网。





