[发明专利]心血管疾病信息实体标注和识别方法、装置和系统在审
| 申请号: | 202111437294.0 | 申请日: | 2021-07-27 |
| 公开(公告)号: | CN114093468A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 陈冠伟 | 申请(专利权)人: | 北京好欣晴移动医疗科技有限公司 |
| 主分类号: | G16H30/40 | 分类号: | G16H30/40;G06F40/295;G06Q40/08;G06V30/40;G16H30/20;G16H50/70 |
| 代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 李莹 |
| 地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 心血管疾病 信息 实体 标注 识别 方法 装置 系统 | ||
本发明公开一种心血管疾病信息实体标注和识别方法、系统及设备,提取数字文件中的全文信息或收集做好切词准备的数据,将数据输入标签函数,基于正则匹配对信息进行分词训练并产生标签,根据模型的入参,将标签数据和原始数据整合后,输入到模型中进行实体识别模型训练产出了结果集以及相应的评分结果。本发明通过模型训练,解决了海量数字文件的信息实体标注的时效和成本问题,并且通过程序实现的方式让非算法人员可以快速实现操作,属于工具类的极大创新,可以广泛应用于数字应用领域的数据标注,为互联网业务和资源对接等提供了便利,大量节约时间和资金成本。
本申请是申请日为2021年7月27日,申请号为CN202110848292.4,发明名称为“数字文件信息实体标注和识别方法、装置和系统”的中国发明专利申请的分案申请。
技术领域
本发明涉及人工智能技术领域,应用于互联网技术方向,尤其涉及一种心血管疾病信息实体标注和识别方法、装置和系统。
背景技术
随着互联网技术的普及,越来越多的应用应运而生,互联网+应用成为方便人们和社会获得更加平等和便捷医疗服务的有效手段,对于数字文件的识别从人工到文本自动识别再到人工智能技术的应用,由于对专业知识人员的要求度极高,不仅需要专业医疗知识,还需要算法或开发的知识,因此不够方便也会极大地增加负担。
发明内容
针对上述缺陷,本发明要解决的技术问题是如何借助人工智能技术和自然语言处理技术感知和识别用户的各种信息并对后续决策流程进行建模,实现自动执行和智能决策。
针对上述缺陷,本发明的目的在于提供一种心血管疾病信息实体标注和识别方法、系统及电子设备、计算机存储介质和程序产品。
应用于服务器端,提取数字文件中的全文信息或收集做好切词准备的数据,将数据输入标签函数,基于正则匹配对信息进行分词训练并产生标签,根据模型的入参,将标签数据和原始数据整合后,输入到模型中进行实体识别模型训练产出了结果集以及相应的评分结果。
优选的,根据需求创建任务,关联训练模型,分配计算空间后上传要打标的数据集。
优选的,通过词表将纯文本处理成表格中的数据四元组数据,关键字、实体类型、位置以及文本下标。
优选的,将数据作为标签函数的输入,通过Snorkel模型的训练后针对每一行数据都产生一个实体。
优选的,具体包括:
S1、从用户输入的文本材料中提取全文本信息;
S2、对文本信息进行切词处理;
S3、通过词表,将纯文本处理成表格中的四元组数据;
S4、关联Snorkel训练模型并分配计算空间;
S5、上传需要打标的数据集;
S6、生成标签函数并进行模型训练;
S7、通过Snorkel训练对输入的数据产出对应的实体;
S8、将标注好的数据与原始数据融合,生成Bert训练的数据。
优选的,数字文件为冠状动脉造影本报告单和/或冠状动脉造影病例报告。
优选的,包括:
S201、从冠状动脉造影本报告单和/或冠状动脉造影病例报告中经过OCR提取全文本信息,包括冠状动脉造影病案号;
S202、通过词表,将纯文本处理成表格中的数据四元组数据,标号为1、2、……,词表为左前降支、右回旋支、……;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京好欣晴移动医疗科技有限公司,未经北京好欣晴移动医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111437294.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





