[发明专利]句子处理装置及其方法无效
| 申请号: | 99105930.1 | 申请日: | 1999-03-30 |
| 公开(公告)号: | CN1232226A | 公开(公告)日: | 1999-10-20 |
| 发明(设计)人: | 安部圭子;葛贯壮四郎;桂晃洋;横田登志美;三浦雅树 | 申请(专利权)人: | 株式会社日立制作所 |
| 主分类号: | G06F17/20 | 分类号: | G06F17/20 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王勇,王岳 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 句子 处理 装置 及其 方法 | ||
本发明涉及一种装置,它允许用户在句子中使用省略符来输入长单词,而不打搅思维的连续性。根据本发明的装置有利于增加使用键盘输入字符的速度和操作性。它还能够用于在使用手写字符识别或语音识别时增加输入速度,并且有利于增加操作性。
当使用字处理软件输入句子时经常体会到,那些与职业和爱好这些个人事物有关的单词,以及他或她自己的名字等经常要重复输入。特别是,在这些经常使用的字符串较长的情况下,重复输入同一长字符串对用户来说是一种负担。
当使用允许用户用笔和写字板输入单词的装置时,由于可能发生对用户输入的字符的识别错误,因此在他或她重复输入这些字符和长句子的情况下对用户是一种负担。
有这样一种装置,它允许用户部分省略一些字符或句子来进行输入,从而减少用户的负担。
例如,在日本专利申请特开号7-191986(1995)中公开了一种技术,当用户输入包括省略字符的单词的句子时,它通过参考存储了语法编码规则和单词使用样本的存储器,来预测想要的单词和内插省略的字符。在日本专利申请特开号5-28180(1993)中公开了一种技术,它准备一个存储象名词类动词类和动词类口语短语这样的相邻单词组合的表,并通过使用该表内插省略的字符和预测想要的单词。
正如上述常规技术所示,内插包括省略字符的句子需要相邻单词之间的单词到单词的关系信息。例如,在日本专利申请特开号7-191986(1995)中,m语法编码规则和单词使用样本被用做该信息,而在日本专利申请特开号5-28180(1993)中,相邻单词组合被用做该信息。
然而,这要求通过参考大量参考句子来准备这样一个单词到单词的关系信息,并且仅仅靠手工不容易准备该信息。
上面描述的常规技术假设句子中省略单一的单词或字符,而没有提到在一个省略多个单词和/或字符的句子中进行内插。
本发明的一个目的是提供一种用于内插一个句子的装置,在该句子中省略多个单词和/或字符。
本发明的另一个目的是提供一种用于自动提取单词一单词关系信息并制备一个词典的装置。
上述目的能够通过文件或句子处理装置实现,该装置具有用于输入字符的输入单元,用于显示输入字符的显示单元和用于转换和编辑输入字符的处理单元,其中处理单元包括一个候选单词提取装置,该候选单词提取装置通过参考存储单词及其使用频率的词汇词典,以及参考定义关于单词之间的转换和单词之间的转换概率信息的单词之间的转换的词典,并且通过在词汇词典中检索输入句子中省略的字符前后的字符,来提取省略了字符和/或省略了这些单词的句子的候选单词,以及一个确定装置,它通过参考单词间转换词典在提取的候选单词中选择一个单词。
上述目的能够通过下面的步骤实现,这些步骤包括用来将输入句子分解为单个单词并存储单个单词的协调对及其出现计数的步骤,用于检索单词详细类别(class of a particle)并储存单词间转换计数到转换词典中的步骤,用于通过聚焦包括在输入句子中的省略字符前后的字符来提取省略了字符和/或省略了这些单词的句子的候选单词并且对词汇词典进行检索的步骤,用于通过参考单词间转换的词典在提取的后选单词中选择单个单词的步骤,以及修正选择的单词的出现计数,和在词汇词典中发现选择的单词的情况下,根据单词之间转换信息修正转换词典的步骤。
为了举例以及使描述更加清楚,将参考下面的附图,其中:
图1表示本发明的整个过程。
图2表示本发明的整个操作。
图3表示本发明中建立词典的流程图。
图4表示建立词典的规则。
图5表示词汇词典和转换词典的例子。
图6表示词汇词典和转换词典的例子。
图7表示省略句子的内插操作的流程图。
图8表示候选单词提取处理的流程图。
图9表示最优候选确定处理的流程图。
图10表示最优候选确定的方案。
图11表示词典建立处理的流程图。
图12表示学习词汇词典和转换词典的方案。
图13表示学习词汇词典和转换词典的方案。
图14表示词典学习单词的规则。
图15表示词典学习单词的规则。
图16表示构成内插句子的过程。
图17表示构成内插句子的流程图。
图18表示候选选择的方案。
图19表示省略符的定义。
图20表示本发明的一个应用例子。
图21表示本发明的一个应用例子。
图22表示词汇词典和转换词典。
图23表示本发明的整体结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99105930.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图象解码装置及记录媒体
- 下一篇:盘记录媒体及其制造方法





