[发明专利]一种小学语文作文排比句自动识别的方法在审

申请号：	201910539392.1	申请日：	2019-06-20
公开（公告）号：	CN110598202A	公开（公告）日：	2019-12-20
发明（设计）人：	朱晓亮;谯宇同;龚颖;殷姿;董鑫;石昀东;刘三女牙;杨宗凯	申请（专利权）人：	华中师范大学
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	42208 武汉天力专利事务所	代理人：	吴晓颖
地址：	430079 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分句小学语文自动识别分隔符教育信息化句式特征情感色彩标准差评分器构建语句语料判定引入检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种小学语文作文排比句自动识别的方法，其特征在于该方法包括以下步骤：

(1)输入语料，判断是否有分号；

(2)获取语句的分句个数；若该句中拥有分号，则以分号为分隔符进行排比句的自动识别；若无分号，则以逗号为分隔符进行排比句的自动识别；

利用Python语言中re模块的re.split()函数将句子以指定的分隔符分割为数组，继续使用len()函数得到分句个数，当以分号作为分隔符进行识别时，将re.split()函数指定的分隔符设置为分号；当以逗号作为分隔符进行识别时，将re.split()函数指定的分隔符设置为逗号；

在以分号为分隔符进行识别时，若得到的分句数大于或等于三句，则该句是排比句；反之则不是；

在以逗号为分隔符进行识别时，若得到的分句数大于或等于三句，进入步骤(3)；反之，则该句不是排比句；

(3)分句情感色彩的判定；使用百度情感分析接口API，检测各分句的情感倾向；若该句子中，满足至少三句及以上的分句情感色彩相似，进入步骤(4)；反之，则该句不是排比句；

(4)检测分句之间是否存在公共部分；查找出每相邻两个分句的最长公共部分，并将其存入字符串数组中，将这些公共部分作为排比识别的待定项；

若各分句之间存在公共部分，进入步骤(5)；反之，则该句不是排比句；

(5)计算各待定项在分句中位置的标准差；检测这些排比标识的待定项是否在各分句中位置相近；若相近，则判定该句为排比句，同时，停止对其余待定项的检测；反之，则判定该句不是排比句。

2.根据权利要求1所述的小学语文作文排比句自动识别的方法，其特征在于还包括以下步骤：步骤(1)中，句子是否具有分号利用脚本语言Python进行识别。

3.根据权利要求1所述的小学语文作文排比句自动识别的方法，其特征在于：步骤(4)中，为了查找出每两个相邻分句的最长公共部分，需要确定两个字符串的最长公共子序列，算法设计的核心思想是从前一个字符串的第一个字符开始，依次与后一个字符串中每一个字符进行对比；若字符相同，则记录下该字符在前一个字符串中的位置S，并从该字符开始依次对比两个字符串中的下一个字符，直到两个字符不同为止，这时记录下最后一个相同字符的位置E，则E-S+1即为该公共部分的长度，如此循环直到找到最大的E-S+1为止，这时，从位置S到位置E之间的部分即为两句的最长公共部分。

4.根据权利要求1所述的小学语文作文排比句自动识别的方法，其特征在于：步骤(5)中，对于排比标识的待定项在各个分句中的位置是否相近的判断，采取计算该待定项在各分句中位置的标准差是否小于某个阈值的方法来进行评判；若小于该阈值则判定该待定项在各分句中的位置相近，反之则不相近。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华中师范大学，未经华中师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910539392.1/1.html，转载请声明来源钻瓜专利网。

上一篇：从概率输入识别准确转录
下一篇：一种结合词典的军事想定文书实体信息抽取方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种小学语文作文排比句自动识别的方法在审

专利文献下载