[发明专利]语句解析方法及语句解析装置在审

专利信息
申请号: 201710276537.4 申请日: 2017-04-25
公开(公告)号: CN107247613A 公开(公告)日: 2017-10-13
发明(设计)人: 邢锦江;李剑;朱华;邹雪梅;陈险峰;朱峰登;史可华;董扬威;李亮 申请(专利权)人: 北京航天飞行控制中心
主分类号: G06F9/45 分类号: G06F9/45
代理公司: 北京康信知识产权代理有限责任公司11240 代理人: 吴贵明,张永明
地址: 100094 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语句 解析 方法 装置
【说明书】:

技术领域

发明涉及领域特定语言领域,具体而言,涉及一种语句解析方法及语句解析装置。

背景技术

领域特定语言(Domain-Specific Language,简称为DSL)是针对特定应用领域而设计的计算机语言,它使用约定的文法,表达专业人员的意图,辅助其在该领域中高效地解决问题。

在相关技术中,描述一种计算机语言,一般使用扩展巴科斯范式(Extended Backus-Naur Forms,简称为EBNF)。传统的领域特定语言描述工具,如(Another Tool of Language Recognition,简称为Antlr),能够在一定程度上简化领域特定语言的设计。然而,传统的基于扩展巴科斯范式的计算机语言描述方法,以及现有的语言描述和解析工具(如Antlr)还是存在问题的:例如,在一般的领域特定语言描述方法中,要求以英文作为基本词法要素和关键字。但是,由于难以正确处理复杂的中文断句逻辑,即使允许使用中文作为关键字,也必须像英文一样,在词与词之间增加空格,因此,这种方法并不符合中文的语言习惯。

因此,在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯。

发明内容

本发明实施例提供了一种语句解析方法及语句解析装置,以至少解决在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯的技术问题。

根据本发明实施例的一个方面,提供了一种语句解析方法,包括:获取待解析语句;根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。

可选地,语法采用动态可变数据进行描述;语法包括:用于描述中文领域特定语言的词素的类型的符号,以及,除符号之外的用于对符号进行补充的字典。

可选地,根据中文领域特定语言的语法,对待解析语句进行解析包括:将待解析语句分解为基本词素;对分解的基本词素标注词性;根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。

可选地,在将待解析语句分解为基本词素之前,还包括:采用预定歧义判断算法判断待解析语句是否存在歧义;在判断结果为是的情况下,采用预定规避措施对待解析语句存在的歧义进行规避。

可选地,将待解析语句分解为基本词素包括:采用最长匹配原则,将待解析语句分解为基本词素,其中,最长匹配原则为匹配尽可能长的语句。

可选地,根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树包括以下之一:采用下降式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,下降式语法树解析算法为:在预定的词素位置,依次向前搜索匹配,当匹配的词素引用了除词素所引用的符号之外的其他符号时,匹配其他符号;采用上升式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,上升式语法树解析算法为:构建从待解析语句分解产生的基本词素的父节点,之后采用相同的方式构建父节点的父节点,直至产生唯一的根节点;采用下降式语法树解析算法和上升式语法树解析算法结合的方式,将标注了词性的基本词素解析为语法树。

可选地,在将待解析语句分解为基本词素之前,还包括:采用预定的省略语推断算法,对待解析语句进行推断,将待解析语句还原为完全信息的语句,其中,预定的省略语推断算法包括以下至少之一:根据前文的基本词素,对省略语进行补充的上文推断算法;根据指代时间的基本词素对时间进行推算的时间推断算法;对未指定完整信息的基本词素进行定位的业务对象推断算法。

可选地,在根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树之后,还包括:语法树上的叶子节点将叶子节点的内容传递给叶子节点的父节点;父节点对所包括的所有叶子节点传递的内容进行处理,得到父节点的内容;依次执行:上述内容传递以及处理操作,直至根节点,以根节点的内容作为语法树的最终值,其中,所述最终值用于执行应用程序接口。

根据本发明实施例的另一个方面,还提供了一种语句解析装置,其特征在于,包括:获取模块,用于获取待解析语句;解析模块,用于根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。

可选地,解析模块包括:分词单元,用于将待解析语句分解为基本词素;标注单元,用于对分解的基本词素标注词性;解析单元,用于根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天飞行控制中心,未经北京航天飞行控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710276537.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top