[发明专利]文档处理装置以及文档处理方法在审
申请号: | 201310443274.3 | 申请日: | 2013-09-25 |
公开(公告)号: | CN103678476A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 祖国威;加纳敏行 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 孙蕾 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种文档处理装置以及文档处理方法。文档处理装置具有解析输入的文档数据的句子的解析部(32);从解析部(32)的解析结果中提取规定的接词的接词提取部(33);存储将包含规定的接词的词语是否容易误译的判断标准和规定的接词对应起来的接词检查规则、及用于提取包含容易误译的接词的复合词的复合词提取规则的存储装置(20);当包含从解析结果提取的接词的词语满足接词检测规则中的判断标准的情况下,将提取的接词判定为容易误译的接词的检查部(34);当包含从解析结果提取的接词的词语满足复合词检查规则的情况下,将作为依据该规则的复合词的包含提取的接词的复合词作为容易误译的复合词来提取的复合词提取部(35)。 | ||
搜索关键词: | 文档 处理 装置 以及 方法 | ||
【主权项】:
一种文档处理装置,其特征在于,具备:输入部(31),输入文档数据;解析部(32),对由上述输入部(31)输入的文档数据的句子进行解析;接词提取部(33),从上述解析部(32)的解析结果中提取规定的接词;存储装置(20),存储(a)将包含上述规定的接词的词语是否容易误译的判断标准和上述规定的接词对应起来的接词检查规则、以及(b)用于提取包含容易误译的接词的复合词的复合词提取规则;检查部(34),当包含从上述解析结果中提取出的接词的词语满足在上述接词检查规则中的判断标准的情况下,将上述提取出的接词判定为容易误译的接词;以及复合词提取部(35),当包含从上述解析结果中提取出的接词的词语满足上述复合词检查规则的情况下,将作为依据该规则的复合词的包含上述提取出的接词的复合词作为容易误译的复合词来提取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310443274.3/,转载请声明来源钻瓜专利网。