[发明专利]数据结构化评估方法、装置、存储介质及电子设备有效
申请号: | 201811409577.2 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109582661B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 滕召荣 | 申请(专利权)人: | 金色熊猫有限公司 |
主分类号: | G06F16/20 | 分类号: | G06F16/20 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 郑特强;章侃铱 |
地址: | 中国香港铜锣湾希慎*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据结构 评估 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种数据结构化评估方法、数据结构化评估装置、计算机可读存储介质及电子设备。本公开实施例提供的数据结构化评估方法包括:获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;对比所述结构化结果和所述标注结果得到差异结果;根据所述差异结果计算所述结构化处理的准确率和召回率;将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。本公开实施例提供的数据结构化评估方法避免了结构化与评估之间的反复,提高了对结构化结果进行评估的效率。
技术领域
本公开涉及计算机技术领域,具体涉及一种数据结构化评估方法、数据结构化评估装置、计算机可读存储介质及电子设备。
背景技术
结构化技术是NLP(Natural Language Processing,自然语言处理)中的最重要的一项技术,对结构化结果进行评估是结构化中最费时费力的事情,涉及的流程非常多,而且为了获得良好的结构化效果,此流程还必须反复进行。
现有的对结构化结果进行评估的方法主要是采用线下模式,由开发人员把结构化结果通过excel表格导出给医学人员,医学人员进行评估后再返回给开发人员,如此反复多次,需要大量交互,无法自动化。一方面开发人员与医学人员反复的沟通交互,非常耗费时间;另一方面结构化可能需要医学人员多次进行评估,而且评估结果都只能用excel表格线下保存,且进行反复对比分析的时候,有可能后一次的修改结构化出来的结果效果更差,无法追踪上一次配置是怎么修改的。
由此可见,如何改变结构化结果评估费时费力的现状是目前亟待解决的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种数据结构化评估方法、数据结构化评估装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个技术问题。
根据本公开的一个方面,提供一种数据结构化评估方法,其特殊之处在于,包括:
获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;
对比所述结构化结果和所述标注结果得到差异结果;
根据所述差异结果计算所述结构化处理的准确率和召回率;
将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。
在本公开的一种示例性实施方式中,在对比所述结构化结果和所述标注结果得到差异结果之后,所述方法还包括:
生成包含所述结构化结果和所述标注结果的展示图表;
对所述差异结果和所述结构化结果中的其他结果进行差异化显示。
在本公开的一种示例性实施方式中,在根据所述差异结果计算所述结构化处理的准确率和召回率之后,所述方法还包括:
判断所述准确率和召回率是否满足预设条件;
若判断所述准确率和召回率不满足预设条件,则根据所述差异结果调整所述结构化处理的结构化配置;
使用调整后的结构化配置对所述原始数据进行结构化处理。
在本公开的一种示例性实施方式中,所述对比所述结构化结果和所述标注结果得到差异结果包括:
对比原始数据的整体结构化结果和整体标注结果,得到整体差异结果;
对比原始数据中各个字段集合的集合结构化结果和集合标注结果,得到集合差异结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金色熊猫有限公司,未经金色熊猫有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811409577.2/2.html,转载请声明来源钻瓜专利网。