[发明专利]医疗文本标注方法、装置、设备及存储介质在审
申请号: | 202010897823.4 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112035675A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 胡俊飞 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/242;G06F40/289;G06F40/295;G06F40/30;G06N3/02 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文本 标注 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能技术领域,公开了一种医疗文本标注方法、装置、设备及存储介质。该方法通过设置标注配置表,在接收到标注请求后,根据请求中请求的数据类型调用标注配置表中配置的标注参数来对待标注医疗文本中的知识实体进行批量标注,并且该标注过程中,还使用了医疗知识图谱进行医疗的知识实体进行识别,知识图谱中存在相似或者相同的实体,基于比对即可帮助系统进行快速识别和快熟标注,这样的实现方式不仅提高了用户对医疗文本的实体命名的快速标注,还保证了标注实体的精确度,大大提高了标注效率和用户的使用体验。此外,本发明还涉及区块链技术,医疗文本和实体可存储于区块链中。
技术领域
本申请涉及人工智能技术领域,具体涉及一种医疗文本标注方法、装置、设备及存储介质。
背景技术
随着移动互联网和社交网络的推广,产生了大量的用户生成文本(UserGenerated Content,简称UGC),由于文化背景和表述习惯的不同,人们往往会使用不同的词语和表述方式表达类似的内容。尤其是医疗领域中,由于其医药名称的命名并不是规范的语义命名方式,因此,其识别难度更加大。
目前的实现方式,主要是采用自然语言处理技术来实现自动标注识别。而通过自然语言处理技术还是通过语义的方式来计算识别,从而进行标注,并且在标注后要纠正计算机的错误识别,这就使得完成一次的识别其需要的计算量过大,并且医药名称的语义还不能使用常规的语义解析来来识别,还需要进行大量的训练学习,这非常不利于开发,且成本也高,在使用时,其效率和准确率都比较低。
发明内容
本发明的主要目的是解决现有的医疗文本标注效率和准确度较低的技术问题。
本发明第一方面提供了一种医疗文本标注方法,所述医疗文本标注方法包括:
获取待标注医疗文本以及标注请求;
提取所述标注请求中请求标注的数据的数据类型;
根据所述数据类型,从预置标注配置表中查询所述数据类型对应的标注参数;
利用医学知识图谱,对所述待标注医疗文本进行知识实体的识别,并对识别到的知识实体按照数据类型的实体进行分类,得到实体集合;
查询所述实体集合中与所述标注请求中的数据类型对应的知识实体,并根据所述标注参数进行标注,得到标注文本。
可选地,在本发明第一方面的第一种实现方式中,所述方法还包括:
获取文本修改用户的修改请求;
提取所述修改请求中的配置项目和具体配置参数,其中所述配置项目信息包括标注的数据类型、标注标签号、标签名称和标签颜色,以及标签调用的快捷方式;
基于所述配置项目,在预置标注配置表模板中添加对应的表头名称,并根据所述具体配置参数设置所述表头名称下的显示数据,形成所述标注配置表。
可选地,在本发明第一方面的第二种实现方式中,在所述基于所述配置项目,在预置标注配置表模板中添加对应的表头名称,并根据所述具体配置参数设置所述表头名称下的显示数据,形成所述标注配置表之后,还包括:
获取历史医学实体,并调用自然语言处理技术对所述历史医学本体进行学习,得到实体识别模型;
利用所述所述标注配置表中的标注参数对所述实体识别模型进行标注训练,得到标注模型,其中所述标注模型用于对所述待标注医疗文本中的知识实体进行识别以及预标注。
可选地,在本发明第一方面的第三种实现方式中,所述利用医学知识图谱,对所述待标注医疗文本进行知识实体的识别,并对识别到的知识实体按照数据类型的实体进行分类,得到实体集合包括:
利用自然语言处理技术,提取所述待标注医疗文本中的句子,得到医学句子集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010897823.4/2.html,转载请声明来源钻瓜专利网。