[发明专利]一种基于规则的知识点分类方法在审
申请号: | 201911112555.4 | 申请日: | 2019-11-14 |
公开(公告)号: | CN110866120A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 潘鹏凯;张颀;戴琼;袁琦;虞桂芳;黄迪迪;陆飞 | 申请(专利权)人: | 上海钦文信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 上海领洋专利代理事务所(普通合伙) 31292 | 代理人: | 俞晨波 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 规则 知识点 分类 方法 | ||
1.一种基于规则的知识点分类方法,其特征在于:该基于规则的知识点分类方法的具体步骤如下:
S1:设置句子中每一个token的基本属性:一个英文句子由一系列单词排列而成,将每个单词称作为一个token,每个token都有一系列的属性进行描述,这些属性的集合构成了这个token;
Token的基本属性包括:raw为原始字面、lower为原始字面小写形式、lemma为词根、pos为一种词性、upos为另一种词性、rel为在依存关系树中的依赖关系、head为在依存关系树中的依赖token序号;
token还可以添加自定义属性;
为了使用这些属性来描述token,定义了TQL,其基本表达式如下所示:
{property_1=value_1,property_2=value_2}
当一个token存在property_1和property_2属性,且这些属性的值分别等于value_1和value_2时,称这个token匹配这个TQL:
match(TQL,token)=true;
当需要某个属性在多个取值中任意匹配一个时,可使用以下表达式:
{property_1=v1|v2|v3};
由于lemma是最常使用的属性,为了提供更好的可读性,因此可以将{lemma=v1,p2=v2}写成:
v1{p2=v2};
可以将多个TQL基本单元进行组合,组成更复杂的TQL,以描述一组token序列,当句子中包含某个token的任意序列匹配TQL时,称这个token匹配这个TQL;
S2:检查当前token是否符合Procondition条件,符合则进入下一步骤;
S3:为当前token计算并设置定义属性值;
S4:将当前token与知识点TQL进行匹配,若token匹配TQL,则认为当前token包含对应知识点。
2.根据权利要求1所述的一种基于规则的知识点分类方法,其特征在于:所述自定义属性包括时态类型、主语人称、句法类别、句型、复合句类型、连接词和比较级形式。
3.根据权利要求1所述的一种基于规则的知识点分类方法,其特征在于:所述TQL支持以下几种组合方式:线性组合模式、树状组合模式和混合组合模式。
4.根据权利要求3所述的一种基于规则的知识点分类方法,其特征在于:所述线性组合模式具体为:
{p_11=v_11,p_12=v_12}{p_21=v_21,p_22=v_22};
在句子中,当某个包含token1和token2序列,分别匹配这两个表达式,且token1和token2相邻,且token1位于token2之前,则认为token1和token2均匹配这个TQL;
若允许token1和token2不相邻,则对应的TQL表达式为:
{p_11=v_11,p_12=v_12}...{p_21=v_21,p_22=v_22};
其中,...表示两个token不必相邻。
5.根据权利要求3所述的一种基于规则的知识点分类方法,其特征在于:所述树状组合模式具体为:
若要求token2的head必须是token1,则对应的TQL表达式为:
{p_11=v_11,p_12=v_12}<-{p_21=v_21,p_22=v_22};
其中,<-表示head依赖关系;
当表达式中的token有多个依赖时,你可以使用索引来表示其中的TQL单元;
{p_11=v_11,p_12=v_12}<-{p_21=v_21,p_22=v_22},@0<-{p_31=v_31};
其中,@0指代{p_11=v_11,p_12=v_12}所匹配的token。
6.根据权利要求3所述的一种基于规则的知识点分类方法,其特征在于:所述混合组合模式具体为:
需要混合使用线性模式和树状模式,对应的表达式如下所示:
{p_11=v_11,p_12=v_12}<-({p_21=v_21,p_22=v_22}{p_31=v_31});
其中,()内的TQL表示线性组合模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海钦文信息科技有限公司,未经上海钦文信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911112555.4/1.html,转载请声明来源钻瓜专利网。