[发明专利]单词对齐装置、例句对译词典及单词对齐方法无效
| 申请号: | 200810133966.7 | 申请日: | 2008-07-18 |
| 公开(公告)号: | CN101630313A | 公开(公告)日: | 2010-01-20 |
| 发明(设计)人: | 刘绍明;藤原久美;吴宏林;宋国龙 | 申请(专利权)人: | 富士施乐株式会社 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28 |
| 代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 单词 对齐 装置 例句 对译 词典 方法 | ||
1.一种单词对齐装置,是进行第1语言的例句和作为该例句的对译的第2语言的例句中分别包含的单词间的对齐的单词对齐装置,其特征在于,该单词对齐装置具有:
单词对译词典,其存储第1语言的单词与作为其对译的第2语言的单词、关于第1语言的单词的第2语言的译词、以及关于第2语言的单词的第1语言的译词的对应关系;
输入单元,其输入第1语言的例句和作为该例句的对译的第2语言的例句;
单词提取单元,其从上述所输入的第1语言及第2语言的例句中分别提取第1语言及第2语言的单词;
第1对齐单元,其在上述提取的第1语言的单词和上述提取的第2语言的单词的对应关系包含于上述单词对译词典中时,使上述提取的第1语言的单词与上述提取的第2语言的单词对齐;以及
第2对齐单元,其对于未被上述第1对齐单元对齐的第1语言的单词,在该第1语言的单词与第2语言的译词的对应关系包含于上述单词对译词典中时,使第1语言的单词与和第2语言的译词共同的上述提取的第2语言的多个单词对齐。
2.根据权利要求1所述的单词对齐装置,其特征在于,
单词对齐装置还具有第3对齐单元,该第3对齐单元对于未被第2对齐单元对齐的第1语言的单词,将该第1语言的单词进行分割,在所分割的单词与第2语言的译词的对应关系包含于上述单词对译词典中时,将所分割的单词与和第2语言的译词共同的上述提取的第2语言的多个单词对齐。
3.根据权利要求2所述的单词对齐装置,其特征在于,
单词对齐装置还具有第4对齐单元,该第4对齐单元对于未被第3对齐单元对齐的第1语言的单词,在该第1语言的单词与上述提取的第2语言的单词的表记一致时,使该第1语言的单词与上述提取的第2语言的单词对齐。
4.根据权利要求3所述的单词对齐装置,其特征在于,
上述表记的一致是第1语言的单词与第2语言的单词的各个汉字一致。
5.根据权利要求1至4的任意一项所述的单词对齐装置,其特征在于,
第1及第4对齐单元进行从第1语言的一个单词到第2语言的多个连续单词的对齐,或者从第2语言的一个单词到第1语言的多个连续单词的对齐。
6.一种单词对齐装置,是进行第1语言的例句和作为该例句的对译的第2语言的例句中分别包含的单词间的对齐的单词对齐装置,其特征在于,该单词对齐装置具有:
存储单元,其存储词类连接表,该词类连接表采用对于第1语言的单词和第2语言的单词预先赋予了对齐的信息,表示连续的2个单词的词类的连接关系;
输入单元,其输入第1语言的例句和作为该例句的对译的第2语言的例句;
单词提取单元,其从上述所输入的第1语言及第2语言的例句中分别提取第1语言及第2语言的单词;以及
对齐单元,其在上述提取的第1语言的单词与上述提取的第2语言的连续的多个单词的一部分对齐且剩余单词未被对齐时,在该连续的多个单词包含于上述词类连接表中的情况下,使上述提取的第1语言的单词与第2语言的连续的多个单词对齐。
7.根据权利要求6所述的单词对齐装置,其特征在于,
上述对齐单元在上述提取的连续的多个单词的一部分与上述提取的第2语言的单词对齐且剩余单词未被对齐时,在上述连续的多个单词包含于上述词类连接表中的情况下,使上述提取的连续的第1语言的单词与第2语言的单词对齐。
8.根据权利要求6或7所述的单词对齐装置,其特征在于,
上述词类连接表采用被赋予了单词对齐的语料库,根据语料库所包含的所有连续的2个单词的数和语料库中对齐的连续的2个单词的数的比例,规定具有一定的出现频度的词类的连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810133966.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:成像装置及其快速查找图片的方法
- 下一篇:串行总线从设备地址设置系统





