[发明专利]一种文本修正方法、装置、可读介质及电子设备在审

申请号：	201911252305.0	申请日：	2019-12-09
公开（公告）号：	CN111178049A	公开（公告）日：	2020-05-19
发明（设计）人：	龙泉;郭潇宇	申请（专利权）人：	天津幸福生命科技有限公司
主分类号：	G06F40/232	分类号：	G06F40/232;G16H10/60;G16H15/00
代理公司：	北京嘉科知识产权代理事务所(特殊普通合伙) 11687	代理人：	刘力
地址：	301800 天津市宝坻***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本修正方法装置可读介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种文本修正方法、装置、可读介质及电子设备，包括：获取第一文本信息，并利用预设的识别模型对所述第一文本信息进行识别；当所述识别模型识别到所述第一文本信息中的第一错误信息，生成所述第一错误信息对应的第一位置信息；利用预设的修正模型，根据所述第一错误信息对应的第一位置信息，对所述第一错误信息进行修正，以获得第二文本信息；通过识别模型确定第一文本信息的错误位置，并利用修正模型对第一文本信息中的错误进行修正，从而实现了自动修正医学文本中可能出现的第一错误信息，提高数字化的医学文本的质量，确保后续数据分析的准确性。

技术领域

本发明涉及计算机技术领域，尤其涉及一种文本修正方法、装置、可读介质及电子设备。

背景技术

结合人工智能的数据分析技术，已经开始应用在各个传统领域，其中包括医疗领域。从目前的实际情况来看，可以认为数据分析在医疗领域，乃至与医疗相关的保险服务、健康服务领域，均有着非常重大的应用价值。

在医学领域进行数据分析，其数据的来源通常是过去产生的各种诊疗信息、病历信息等医学文本。在固有的工作方式当中，这些医学文本通常为纸质文件的形式，而且相当一部分内容是手写文本。如需利用纸质文件进行数据分析，就必须将其拍摄为图像，再通过图像识别提取到数字化和结构化的医学文本，才能够应用到当前的数据分析技术当中。

那么很显然，在这一将医学文本从纸质文件进行数字化和结构化的过程中，很容易造成其中出现各种错误。从而影响到后续数据分析的准确性和有效性。

发明内容

本发明提供一种文本修正方法、装置、可读介质及电子设备，能够自动修正医学文本中可能出现的第一错误信息，从而提高数字化的医学文本的质量，确保后续数据分析的准确性。

第一方面，本发明提供了一种文本修正方法，包括：

获取第一文本信息，并利用预设的识别模型对所述第一文本信息进行识别；

当所述识别模型识别到所述第一文本信息中的第一错误信息，生成所述第一错误信息对应的第一位置信息；

利用预设的修正模型，根据所述第一错误信息对应的第一位置信息，对所述第一错误信息进行修正，以获得第二文本信息。

优选地，所述识别模型识别到所述第一文本信息中的第一错误信息，生成所述第一错误信息对应的第一位置信息包括：

当所述识别模型识别到所述第一文本信息中的第一错误字符，将所述第一错误字符确定为所述第一错误信息；

生成对应所述第一文本信息中各个字符的第一字符序列；并将所述第一字符序列中，与所述第一错误字符对应的序列码标记为第一错误序列码；

将标记所述第一错误序列码后的所述第一字符序列，确定为所述第一错误信息对应的第一位置信息。

优选地，所述利用预设的修正模型，根据所述第一错误信息对应的第一位置信息，对所述第一错误信息进行修正包括：