[发明专利]文字信息处理方法和装置无效
| 申请号: | 96115997.9 | 申请日: | 1996-10-04 | 
| 公开(公告)号: | CN1068127C | 公开(公告)日: | 2001-07-04 | 
| 发明(设计)人: | 吴胜远 | 申请(专利权)人: | 吴胜远 | 
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 250061 山东省济*** | 国省代码: | 山东;37 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 文字 信息处理 方法 装置 | ||
1. 一种文字信息处理方法,一个字或字符用一个机内码表示,由两个或两个以上的字或字符构成的词用相应的单级内码表示,所述文字信息处理方法的特征在于:
(1)由两个或两个以上的字或字符构成的词除了用相应的单级内码集合表示以外,还用相应的多级内码表示;
(2)发音不同的字、或字符、或词用不同的机内码表示,其中一个音对应的机内码为单级内码,而其余发音对应的机内码为多级内码;
所述文字信息处理方法包括如下步骤:
(1)将由两个或两个以上的字或字符构成的词所对应的多级内码转换为相应字或字符的单级内码;
(2)将多音字或词对应的多级内码转换为相应的单级内码。
2. 如权利要求1所述的文字信息处理方法,其特征在于:
多级内码转换为单级内码使用成分库装置和重音字成分库装置,操作步骤如下;
(1)计算步骤;根据多级内码计算该多级内码在成分库或重音字成分库装置中相应的成分项在成分库装置中的位置;
(2)转换步骤:用相应成分项取代多级内码,如果成分项中不含多级内码转(4);
(3)识别步骤:根据多级内码的编码特点,识别相应成分项中是否含多级内码,如果含多级内码转(1);
(4)转换结束。
3.如权利要求1所述的文字信息处理方法,其特征在于:
采用多向转换将单级内码转换为多级内码,多向转换分为词的多向转换和字的多向转换,词的多向转换使用成分库装置,映射成分库装置和其索引装置,映射成分库中的映射成分项按相应的成分项的单级内码的大小顺序排列,字的多同转换使用字音库装置、重音字音库装置和重音字成分库装置;
所述词的多向转换的操作步骤如下;
(1)查索引步骤,根据相应内码查索引装置,若查到此地址,继续,否则返 回;
(2)比较匹配步骤,将映射成分项与对应的被转换的文字信息相比较,根据结果作如下选择;
若满足跳出条件转最后处理步骤,
若相等,则执行匹配操作;
(3)移动步骤,将映射成分项按前进方向移动一项,转比较匹配步骤;
(4)最后处理步骤,若匹配,返回最后匹配的映射成分项相应的多级内码;
所述字的多向转换操作步骤如下;
(1)根据转换的字的单级内码,查字音库,若该字不为重音字,转(4);
(2)该重音字是主音否,若为主音,转(4);
(3)查重音字成分库装置,根据重音字音库装置,将该字的单级内码用其相应次音对应的多级内码替代;
(4)转换结束。
4.一种文字信息处理方法,一个字或字符用一个机内码表示,由两个或两个以上的字或字符构成的词用相应的单级内码表示,所述文字信息处理方法的特征在于:
多向转换的方法用于单级内码或多级内码表示的文字信息的最大匹配中,词典由词典项组成,词典项含匹配用的成分项,词典项按成分项相应内码的大小顺序排列;
文字信息序列的最大匹配的操作步骤如下:
(1)扫描文字信息序列,根据相应内码查索引装置,若查到地址项,继续,否则返回;
(2)通过比较装置比较成分项与对应的被匹配的文字信息序列中的相应部分;
根据比较结果作如下动作选择:
若结果满足跳转条件,转步骤(4);
若相等,执行匹配操作;
(3)将词典项按前进方向移动一项,转步骤(2);
(4)若匹配,则最后返回最大匹配的文字信息;
上述步骤中的执行匹配操作一般是执行“置位匹配标志,匹配指针指向该成分项”,匹配操作的目的是为了最后能返回最大匹配的成分项;
上述的“跳出条件”是指:当成分项按相应的单级内码升序捧列时为:成分项大于被切分的文字信息;
降序排列时为:成分项小于被切分的文字信息:
上述的前进方向是指:成分项按相应的单级内码升序捧列时为:成分项的升序方向;
降序排列是为:成分项的降序方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴胜远,未经吴胜远许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/96115997.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:耐磨烧结合金及其生产方法和用其制成的滚轮
- 下一篇:生产蛋白酶的方法





