[发明专利]一种小学语文作文排比句自动识别的方法在审
申请号: | 201910539392.1 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110598202A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 朱晓亮;谯宇同;龚颖;殷姿;董鑫;石昀东;刘三女牙;杨宗凯 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 42208 武汉天力专利事务所 | 代理人: | 吴晓颖 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分句 小学语文 自动识别 分隔符 教育信息化 句式特征 情感色彩 标准差 评分器 构建 语句 语料 判定 引入 检测 | ||
1.一种小学语文作文排比句自动识别的方法,其特征在于该方法包括以下步骤:
(1)输入语料,判断是否有分号;
(2)获取语句的分句个数;若该句中拥有分号,则以分号为分隔符进行排比句的自动识别;若无分号,则以逗号为分隔符进行排比句的自动识别;
利用Python语言中re模块的re.split()函数将句子以指定的分隔符分割为数组,继续使用len()函数得到分句个数,当以分号作为分隔符进行识别时,将re.split()函数指定的分隔符设置为分号;当以逗号作为分隔符进行识别时,将re.split()函数指定的分隔符设置为逗号;
在以分号为分隔符进行识别时,若得到的分句数大于或等于三句,则该句是排比句;反之则不是;
在以逗号为分隔符进行识别时,若得到的分句数大于或等于三句,进入步骤(3);反之,则该句不是排比句;
(3)分句情感色彩的判定;使用百度情感分析接口API,检测各分句的情感倾向;若该句子中,满足至少三句及以上的分句情感色彩相似,进入步骤(4);反之,则该句不是排比句;
(4)检测分句之间是否存在公共部分;查找出每相邻两个分句的最长公共部分,并将其存入字符串数组中,将这些公共部分作为排比识别的待定项;
若各分句之间存在公共部分,进入步骤(5);反之,则该句不是排比句;
(5)计算各待定项在分句中位置的标准差;检测这些排比标识的待定项是否在各分句中位置相近;若相近,则判定该句为排比句,同时,停止对其余待定项的检测;反之,则判定该句不是排比句。
2.根据权利要求1所述的小学语文作文排比句自动识别的方法,其特征在于还包括以下步骤:步骤(1)中,句子是否具有分号利用脚本语言Python进行识别。
3.根据权利要求1所述的小学语文作文排比句自动识别的方法,其特征在于:步骤(4)中,为了查找出每两个相邻分句的最长公共部分,需要确定两个字符串的最长公共子序列,算法设计的核心思想是从前一个字符串的第一个字符开始,依次与后一个字符串中每一个字符进行对比;若字符相同,则记录下该字符在前一个字符串中的位置S,并从该字符开始依次对比两个字符串中的下一个字符,直到两个字符不同为止,这时记录下最后一个相同字符的位置E,则E-S+1即为该公共部分的长度,如此循环直到找到最大的E-S+1为止,这时,从位置S到位置E之间的部分即为两句的最长公共部分。
4.根据权利要求1所述的小学语文作文排比句自动识别的方法,其特征在于:步骤(5)中,对于排比标识的待定项在各个分句中的位置是否相近的判断,采取计算该待定项在各分句中位置的标准差是否小于某个阈值的方法来进行评判;若小于该阈值则判定该待定项在各分句中的位置相近,反之则不相近。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910539392.1/1.html,转载请声明来源钻瓜专利网。