[发明专利]一种全自动汉语分词系统无效
| 申请号: | 96100831.8 | 申请日: | 1996-01-30 |
| 公开(公告)号: | CN1107276C | 公开(公告)日: | 2003-04-30 |
| 发明(设计)人: | 陈肇雄;黄河燕 | 申请(专利权)人: | 华建机器翻译有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 北京北新智诚专利代理有限公司 | 代理人: | 张卫华 |
| 地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种全自动汉语分词系统,包括(1)汉语源语输入装置,(2)自动断句装置,(3)将句子字符转变成图结点的结点结构生成装置,(4)确定词长的边求解装置,在边求解的同时,进行歧义判断,并做相应的歧义标识,(5)推理消歧装置,(6)结果输出装置。该系统能高效、灵活、准确地将句子切分成词序列,为准确地翻译打下良好的基础。 | ||
| 搜索关键词: | 一种 全自动 汉语 分词 系统 | ||
【主权项】:
1、一种全自动汉语分词系统,其特征在于包括:(1)汉语源语输入装置;(2)根据汉语句末的标点符号自动断句的装置;(3)将句子字符转变成图结点的结点结构生成装置;(4)确定词长的边求解装置,该装置在边求解的同时,进行歧义判断,并做相应的歧义标识;(5)根据歧义标识,运用歧义规则推理消除歧义的推理消歧装置,其含有歧义规则库和叠词规则装置,消歧规则的形式为:前驱边属性集当前边属性集→上下文条件测试|动作函数名;(6)结果输出装置,该装置通过遍历词切分路径得到用于输出的词切分结构,汉语源语输入装置启动自动断句装置工作,结点结构生成装置将自动断句的装置所断的句子中的字符转变成图结点,形成待切的结点序列送边求解装置,边求解装置对结点序列求边,推理消歧装置对求得的边进行推理,得到切分后的句子,送入结果输出装置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华建机器翻译有限公司,未经华建机器翻译有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/96100831.8/,转载请声明来源钻瓜专利网。





