[发明专利]一种基于规则的自动汉语句法分析方法有效

申请号：	201510613102.5	申请日：	2015-09-23
公开（公告）号：	CN105320644B	公开（公告）日：	2018-01-02
发明（设计）人：	闻永毅	申请（专利权）人：	陕西中医药大学;闻永毅
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	西安弘理专利事务所61214	代理人：	罗笛
地址：	710048 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于规则自动汉语句法分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于规则的自动汉语句法分析方法，其特征在于，具体按以下步骤实施：

步骤1，设计控制器，建立数据库，设置句法分析的层次属性：

控制器包括词性控制器、短语结构控制器、搭配控制器、句子结构控制器四种类型，用来分析短语和句子的结构、控制句法分析的流程以及调用各种词典；

词性控制器，负责定义词性标注的标准；

短语结构控制器，负责定义短语结构、分析短语成分；

句子结构控制器，负责定义句子结构、确定子句范围、配置子句成分；

搭配控制器，负责处理双核和三核短语，并进行搭配识别；

数据库包括标准词典、分类词典、搭配词典、末端词典以及感知词典；

句法分析的层次属性包括语序、原文、词性、短语层、短语功能、搭配层、子句层、子句功能、修饰语层、处理状态、源词性；

步骤2，标注词性：

计算机读入句子，以经过分词系统加工过的分词文件为源文件，按照词性控制器设定的词性标注标准，访问标准词典和分类词典，判断并标记句中词汇的词性；

步骤3，句末短语识别和句末句法功能分析：

短语控制器访问搭配词典和末端词典，按照短语控制器设定的处理规则，识别短语；随后按照句子结构控制器设定的步骤，判断句末成分zhi及其范围并确定下一步处理的起点；

步骤4，句中短语识别和句中句法功能分析：

从步骤3设定的起点开始，按照短语控制器设定的处理规则，继续处理句中短语，再次访问搭配词典、末端词典和感知词典，并通过短语控制器和搭配控制器相配合，完成句中短语分析任务；伴随每一次短语识别操作，同时配置句中成分vmid，并把句中成分vmid的修饰语记录在短语功能属性中；按照流程继续处理，最后一个被识别的vmid就是句首处理的起点，而句中成分的范围就是首个vmid跟最后一个vmid之间的跨距；

步骤5，句首短语识别和句首句法功能分析：

从步骤4设定的起点开始，判断句首句法功能和范围，然后按照句首短语结构和处理流程，完成句首成分sj的识别；

步骤6，系统数据结构调整，并输出文本：

根据用户对于所需分析句子内容的需求，输出相对应的数据文本。

2.根据权利要求1所述的一种基于规则的自动汉语句法分析方法，其特征在于，所述词性控制器中词性分为六个大类，分别为：体词、动词、形容词、语气词、介词、连词，还包括特殊类，词性标注的具体标准如下：

体词，简称n，包括以下细类：空间词nd，时间词nt，动物词nr，数词nh，量词n2，代词pron，指示词det，区别词nb，后置词nsuf，方位词nf，普通体词nc；

动词，简称v，包括以下细类：感知言语类vj，使役类vc，事件类event，情态类vh，是类shi，存在类have，着了过ve，后置类vsuf，常规动词vt；

形容词，简称a，包括以下细类：性质词adj，状态词ade，后置词asuf；

语气词，简称yu，包括以下细类：副词adv，否定词bu，常规语气词yw；

介词，简称p，包括以下细类：把类pba，被类pbei，所类psuo，常规介词prep；

连词，简称conj，包括以下细类：并列词，连接词；

特殊类，包括以下细类：的de1，地de2，得de3；然类ynd。