[发明专利]一种文本修正方法、装置、可读介质及电子设备在审
| 申请号: | 201911252305.0 | 申请日: | 2019-12-09 |
| 公开(公告)号: | CN111178049A | 公开(公告)日: | 2020-05-19 |
| 发明(设计)人: | 龙泉;郭潇宇 | 申请(专利权)人: | 天津幸福生命科技有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G16H10/60;G16H15/00 |
| 代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 刘力 |
| 地址: | 301800 天津市宝坻*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 修正 方法 装置 可读 介质 电子设备 | ||
本发明公开了一种文本修正方法、装置、可读介质及电子设备,包括:获取第一文本信息,并利用预设的识别模型对所述第一文本信息进行识别;当所述识别模型识别到所述第一文本信息中的第一错误信息,生成所述第一错误信息对应的第一位置信息;利用预设的修正模型,根据所述第一错误信息对应的第一位置信息,对所述第一错误信息进行修正,以获得第二文本信息;通过识别模型确定第一文本信息的错误位置,并利用修正模型对第一文本信息中的错误进行修正,从而实现了自动修正医学文本中可能出现的第一错误信息,提高数字化的医学文本的质量,确保后续数据分析的准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种文本修正方法、装置、可读介质及电子设备。
背景技术
结合人工智能的数据分析技术,已经开始应用在各个传统领域,其中包括医疗领域。从目前的实际情况来看,可以认为数据分析在医疗领域,乃至与医疗相关的保险服务、健康服务领域,均有着非常重大的应用价值。
在医学领域进行数据分析,其数据的来源通常是过去产生的各种诊疗信息、病历信息等医学文本。在固有的工作方式当中,这些医学文本通常为纸质文件的形式,而且相当一部分内容是手写文本。如需利用纸质文件进行数据分析,就必须将其拍摄为图像,再通过图像识别提取到数字化和结构化的医学文本,才能够应用到当前的数据分析技术当中。
那么很显然,在这一将医学文本从纸质文件进行数字化和结构化的过程中,很容易造成其中出现各种错误。从而影响到后续数据分析的准确性和有效性。
发明内容
本发明提供一种文本修正方法、装置、可读介质及电子设备,能够自动修正医学文本中可能出现的第一错误信息,从而提高数字化的医学文本的质量,确保后续数据分析的准确性。
第一方面,本发明提供了一种文本修正方法,包括:
获取第一文本信息,并利用预设的识别模型对所述第一文本信息进行识别;
当所述识别模型识别到所述第一文本信息中的第一错误信息,生成所述第一错误信息对应的第一位置信息;
利用预设的修正模型,根据所述第一错误信息对应的第一位置信息,对所述第一错误信息进行修正,以获得第二文本信息。
优选地,所述识别模型识别到所述第一文本信息中的第一错误信息,生成所述第一错误信息对应的第一位置信息包括:
当所述识别模型识别到所述第一文本信息中的第一错误字符,将所述第一错误字符确定为所述第一错误信息;
生成对应所述第一文本信息中各个字符的第一字符序列;并将所述第一字符序列中,与所述第一错误字符对应的序列码标记为第一错误序列码;
将标记所述第一错误序列码后的所述第一字符序列,确定为所述第一错误信息对应的第一位置信息。
优选地,所述利用预设的修正模型,根据所述第一错误信息对应的第一位置信息,对所述第一错误信息进行修正包括:
确定所述第一错误信息中的第一错误序列码;
根据所述第一错误序列码,确定所述第一文本信息中的第一错误字符;
对所述第一文本信息中的第一错误字符进行修正。
优选地,所述利用预设的识别模型对所述第一文本信息进行识别包括:
利用所述识别模型中经过预先训练确定的第一识别算法,对所述第一文本信息进行识别;
则所述利用预设的修正模型对所述第一错误信息进行修正包括;
利用所述修正模型中经过预先训练确定的第一修正算法,对所述第一错误信息进行修正。
优选地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津幸福生命科技有限公司,未经天津幸福生命科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911252305.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种股票波动预测方法及装置
- 下一篇:基于分级控制的软件自适应方法





