[发明专利]文本比对方法、装置、介质及电子设备在审
申请号: | 202110571704.4 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113407665A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 庄妮;陈露露;黄灿;王长虎 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06K9/62 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贾会玲 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 方法 装置 介质 电子设备 | ||
本公开涉及一种文本比对方法、装置、介质及电子设备,包括:获取原始文本文件和比对文本文件;根据原始文本文件和比对文本文件分别获取由原始文本构成的第一字符串和由比对文本构成的第二字符串;将第一字符串和第二字符串进行比对,确定比对结果;将比对结果显示在原始文本文件和/或比对文本文件中。这样,在对原始文本文件和该比对文本文件进行比对时无需考虑两个字符串中的字符之外的任何文件信息,简化了不同文本文件之间进行比对的方法,具有较快的文本比对速度,提高了文本比对的效率,而且比对结果还能够在原始文本文件和/或比对文本文件中进行显示,从而使得比对结果能够更加直观地展示出来。
技术领域
本公开涉及文本处理技术领域,具体地,涉及一种文本比对方法、装置、介质及电子设备。
背景技术
现有技术中进行文本比对一般需要对待比较的数据具有相同的数据格式,例如都为PDF格式、或者都为文本文档等,在需要进行比较的文本内容所在的文件格式不统一时,往往无法对文本内容进行获取以及处理。并且现有技术中对格式相同的文件进行文本对比时,通常都耗时较长,在需要快速比对的场景下不能满足比对速度要求。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种文本比对方法,所述方法包括:
获取原始文本文件和比对文本文件;
根据所述原始文本文件和所述比对文本文件分别获取由原始文本构成的第一字符串和由比对文本构成的第二字符串;
将所述第一字符串和所述第二字符串进行比对,确定比对结果;
将所述比对结果显示在所述原始文本文件和/或所述比对文本文件中。
第二方面,本公开提供一种文本比对装置,所述装置包括:
第一获取模块,用于获取原始文本文件和比对文本文件;
第二获取模块,用于根据所述原始文本文件和所述比对文本文件分别获取由原始文本构成的第一字符串和由比对文本构成的第二字符串;
比对模块,用于将所述第一字符串和所述第二字符串进行比对,确定比对结果;
处理模块,用于将所述比对结果显示在所述原始文本文件和/或所述比对文本文件中。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现上述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现以上所述方法的步骤。
通过上述技术方案,在对原始文本文件和该比对文本文件进行比对时,能够将该原始文本文件中识别到的原始文本和该比对文本文件中识别到的比对文本分别构成该第一字符串和第二字符串,从而在对原始文本文件和该比对文本文件进行比对时无需考虑两个字符串中的字符之外的任何文件信息,大大简化了不同文本文件之间进行比对的方法,具有较快的文本比对速度,提高了文本比对的效率,而且根据原始文本文件对应的第一字符串和比对文本文件对应的第二字符串比对得到的比对结果还能够显示在该原始文本文件和/或该比对文本文件中,从而使得该比对结果能够更加直观地展示出来。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110571704.4/2.html,转载请声明来源钻瓜专利网。