[发明专利]用于比较文本的设备和方法无效
申请号: | 201310392331.X | 申请日: | 2013-09-02 |
公开(公告)号: | CN103440231A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 李明 | 申请(专利权)人: | 北京网秦天下科技有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵伟 |
地址: | 100013 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 比较 文本 设备 方法 | ||
技术领域
本发明涉及信息处理领域,更具体地,涉及一种用于比较文本的设备和一种用于比较文本的方法。
背景技术
校对过程(文本比较过程)主要应用在出版领域。一般由经过专业训练的校对人员对稿件进行校对。软件开发过程中,由于设计到本地化的问题,需要对其中使用的语言进行翻译然后进行校对。这些专业校对人员可以完成语义和语法的校对,但对于其中涉及的格式化信息一般很难进行正确的校对。目前常用的方式是:专业校对人员完成语义和语法等校对,然后交由软件开发工程师,完成格式化信息的校对。
格式化信息可以理解为是为了对字符串中的部分内容进行动态替换而定义的格式化字符串。具体地,格式化字符串可以包含一些占位符,表示在运行时要使用可变信息替换的数据。例如,“Hello everyone,my name is%1$s”是格式化字符串,其中的占位符的定义如下:使用%[index]$[type]格式进行标记,index标记替换资源中第index个资源对应的位置,type则标示所要替换的资源的类型(s表示资源为字符串格式)。
然而,这种校对方式将占用软件开发工程师的大量时间,并且随着语言版本的增多,工作量将随之增加。
发明内容
为了解决上述问题,本发明提供了一种用于比较文本的设备和一种用于比较文本的方法。本发明首先提取格式化模板中的格式化信息,然后和待比较的文本进行比较,最后输出包含错误格式化信息的文本数据。
具体地,根据本发明的第一方案,提供了一种用于比较文本的设备,包括:第一提取单元,被配置为从模板中提取包含格式化信息的文本数据,并将所提取的文本数据保存到第一数据表中;第二提取单元,被配置为从待比较的文本数据中提取包含格式化信息的文本数据,并将所提取的文本数据保存到第二数据表中;比较单元,被配置为将第一数据表中的每一项文本数据所包含的格式化信息与第二数据表中的对应文本数据所包含的格式化信息进行比较;以及输出单元,被配置为输出通过比较单元获得的、格式化信息不完全相同的文本数据。
在一个实施例中,所述第一提取单元和所述第二提取单元均被配置为:将文本数据的ID和文本数据的值保存到所述数据表中。
在一个实施例中,所述比较单元还被配置为:针对第一数据表中的每一项文本数据,将所述文本数据包含的格式化信息保存在第一数组中,并将第二数据表中的对应文本数据所包含的格式化信息保存在第二数组中;以及比较第一数组和第二数组中的每个元素,只有两个数组中的元素完全相同,才确定该文本数据包含的格式化信息相同。
在一个实施例中,所述输出单元还被配置为:针对每一项具有不同格式化信息的文本数据,输出该文本数据的ID、第一数据表中该文本数据的值以及第二数据表中该文本数据的值。
根据本发明的第二方案,提供了一种用于比较文本的方法,包括:从模板中提取包含格式化信息的文本数据,并将所提取的文本数据保存到第一数据表中;从待比较的文本数据中提取包含格式化信息的文本数据,并将所提取的文本数据保存到第二数据表中;将第一数据表中的每一项文本数据所包含的格式化信息与第二数据表中的对应文本数据所包含的格式化信息进行比较;以及输出通过比较步骤获得的、格式化信息不完全相同的文本数据。
在一个实施例中,将文本数据的ID和文本数据的值保存到所述数据表中。
在一个实施例中,针对第一数据表中的每一项文本数据,将所述文本数据包含的格式化信息保存在第一数组中,并将第二数据表中的对应文本数据所包含的格式化信息保存在第二数组中;以及比较第一数组和第二数组中的每个元素,只有两个数组中的元素完全相同,才确定该文本数据包含的格式化信息相同。
在一个实施例中,针对每一项具有不同格式化信息的文本数据,输出该文本数据的ID、第一数据表中该文本数据的值以及第二数据表中该文本数据的值。
通过本发明的方法,可以自动实现新增语言版本中的格式化信息的比较,从而节省了时间成本,提高了效率。
附图说明
通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
图1是示出了根据本发明的一个实施例的用于比较文本的设备的框图。
图2是示出了根据本发明的一个实施例的用于比较文本的方法的流程图。
在本发明的所有附图中,相同或相似的结构均以相同或相似的附图标记标识。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京网秦天下科技有限公司,未经北京网秦天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310392331.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文书管理系统及方法
- 下一篇:一种基于融合乘加指令加速FFT计算的方法