[发明专利]语句解析方法及语句解析装置在审
申请号: | 201710276537.4 | 申请日: | 2017-04-25 |
公开(公告)号: | CN107247613A | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | 邢锦江;李剑;朱华;邹雪梅;陈险峰;朱峰登;史可华;董扬威;李亮 | 申请(专利权)人: | 北京航天飞行控制中心 |
主分类号: | G06F9/45 | 分类号: | G06F9/45 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 吴贵明,张永明 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 解析 方法 装置 | ||
技术领域
本发明涉及领域特定语言领域,具体而言,涉及一种语句解析方法及语句解析装置。
背景技术
领域特定语言(Domain-Specific Language,简称为DSL)是针对特定应用领域而设计的计算机语言,它使用约定的文法,表达专业人员的意图,辅助其在该领域中高效地解决问题。
在相关技术中,描述一种计算机语言,一般使用扩展巴科斯范式(Extended Backus-Naur Forms,简称为EBNF)。传统的领域特定语言描述工具,如(Another Tool of Language Recognition,简称为Antlr),能够在一定程度上简化领域特定语言的设计。然而,传统的基于扩展巴科斯范式的计算机语言描述方法,以及现有的语言描述和解析工具(如Antlr)还是存在问题的:例如,在一般的领域特定语言描述方法中,要求以英文作为基本词法要素和关键字。但是,由于难以正确处理复杂的中文断句逻辑,即使允许使用中文作为关键字,也必须像英文一样,在词与词之间增加空格,因此,这种方法并不符合中文的语言习惯。
因此,在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯。
发明内容
本发明实施例提供了一种语句解析方法及语句解析装置,以至少解决在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯的技术问题。
根据本发明实施例的一个方面,提供了一种语句解析方法,包括:获取待解析语句;根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。
可选地,语法采用动态可变数据进行描述;语法包括:用于描述中文领域特定语言的词素的类型的符号,以及,除符号之外的用于对符号进行补充的字典。
可选地,根据中文领域特定语言的语法,对待解析语句进行解析包括:将待解析语句分解为基本词素;对分解的基本词素标注词性;根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。
可选地,在将待解析语句分解为基本词素之前,还包括:采用预定歧义判断算法判断待解析语句是否存在歧义;在判断结果为是的情况下,采用预定规避措施对待解析语句存在的歧义进行规避。
可选地,将待解析语句分解为基本词素包括:采用最长匹配原则,将待解析语句分解为基本词素,其中,最长匹配原则为匹配尽可能长的语句。
可选地,根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树包括以下之一:采用下降式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,下降式语法树解析算法为:在预定的词素位置,依次向前搜索匹配,当匹配的词素引用了除词素所引用的符号之外的其他符号时,匹配其他符号;采用上升式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,上升式语法树解析算法为:构建从待解析语句分解产生的基本词素的父节点,之后采用相同的方式构建父节点的父节点,直至产生唯一的根节点;采用下降式语法树解析算法和上升式语法树解析算法结合的方式,将标注了词性的基本词素解析为语法树。
可选地,在将待解析语句分解为基本词素之前,还包括:采用预定的省略语推断算法,对待解析语句进行推断,将待解析语句还原为完全信息的语句,其中,预定的省略语推断算法包括以下至少之一:根据前文的基本词素,对省略语进行补充的上文推断算法;根据指代时间的基本词素对时间进行推算的时间推断算法;对未指定完整信息的基本词素进行定位的业务对象推断算法。
可选地,在根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树之后,还包括:语法树上的叶子节点将叶子节点的内容传递给叶子节点的父节点;父节点对所包括的所有叶子节点传递的内容进行处理,得到父节点的内容;依次执行:上述内容传递以及处理操作,直至根节点,以根节点的内容作为语法树的最终值,其中,所述最终值用于执行应用程序接口。
根据本发明实施例的另一个方面,还提供了一种语句解析装置,其特征在于,包括:获取模块,用于获取待解析语句;解析模块,用于根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。
可选地,解析模块包括:分词单元,用于将待解析语句分解为基本词素;标注单元,用于对分解的基本词素标注词性;解析单元,用于根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天飞行控制中心,未经北京航天飞行控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710276537.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:作业描述方法及装置
- 下一篇:在软件编译时检查应用信息的方法