[发明专利]一种在线课程知识树的生成关联方法有效
| 申请号: | 202011018522.6 | 申请日: | 2020-09-24 |
| 公开(公告)号: | CN112231522B | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 陈浩;赵翌臣;赵玉成;肖富贵 | 申请(专利权)人: | 北京奥鹏远程教育中心有限公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 北京集智东方知识产权代理有限公司 11578 | 代理人: | 陈亚斌;关兆辉 |
| 地址: | 100081 北京市海淀区西三*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 在线 课程 知识 生成 关联 方法 | ||
1.一种在线课程知识树的生成关联方法,其特征在于,所述方法包括:
基于对PPT样式的图片和/或文字和/或符号的识别,训练OCR模型和YOLO目标检测模型;
基于对在线课程的大纲的爬取,获取所述在线课程的知识树主分支;
基于所述OCR模型、YOLO目标检测模型和所述在线课程的视频,捕捉并处理所述视频中的PPT画面,获取所述PPT画面的OCR结果;
基于预设规则从所述OCR结果中抽取知识点;
层级化所述知识点,并获取所述知识点在所述视频中的起止时间;
合并所述知识点至所述知识树主分支,生成所述在线课程知识树;
基于所述OCR模型和/或ASR模型,获取所述在线课程的视频的字幕信息和/或语音信息,将所述知识点与所述在线课程的试题进行关联;
其中,所述基于对PPT样式的图片和/或文字和/或符号的识别,训练OCR模型和YOLO目标检测模型,具体为:
选择OCR模型,所述OCR模型包括clovaai文字识别模型;
基于程序批量化生成的训练数据,训练选择的OCR模型,生成所述OCR模型的中文语料;
增加所述YOLO目标检测模型对特殊符号的检测识别、定位以及尺寸估算,所述特殊符号包括wingdings符号。
2.根据权利要求1所述的在线课程知识树的生成关联方法,其特征在于,
所述clovaai文字识别模型的识别步骤,具体为,
基于图像进行卷积,提取特征;
基于LSTM处理所述特征;
前向传播并产生预测文字。
3.根据权利要求1所述的在线课程知识树的生成关联方法,其特征在于,
所述增加所述YOLO目标检测模型对特殊符号的检测识别、定位以及尺寸估算,具体为,
建立特殊符号目标检测模型,基于包含抗锯齿与换色算法的图像合成算法,批量生成所述特殊符号的训练数据。
4.根据权利要求3所述的在线课程知识树的生成关联方法,其特征在于,
所述抗锯齿与换色算法,具体为,
定义图像红绿蓝三通道分别为CRed、CGreen、CBlue;
当将所述特殊符号变成红色主色调,然后叠加到一张背景图片时,即CRed=cRed,CGreen=0,CBlue=0,其中cRed∈[0,255],
将所述背景图片的红色通道像素减去cRed,即CRed=CRed-cRed,获取记作img_bg的第一结果;
将所述特殊符号的图片的红绿蓝三通道均除以255,即CRed=CRed/255,CGreen=CGreen/255,CBlue=CBlue/255,获取记作img_wingdings的第二结果;
将img_bg与img_wingdings逐点相乘,获取记作img的第三结果;
将img的红色通道加上cRed,即CRed=CRed+cRed。
5.根据权利要求4所述的在线课程知识树的生成关联方法,其特征在于,
所述增加所述YOLO目标检测模型对特殊符号的检测识别、定位以及尺寸估算,具体还包括,
截取文字行向左扩展2倍字高的区域作为目标检测的图像;
定位所述特殊符号的位置;
识别定位的所述特殊符号的图像类别;
计算所述特殊符号的面积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奥鹏远程教育中心有限公司,未经北京奥鹏远程教育中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011018522.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种悬挂自卸式永磁除铁器
- 下一篇:一种数字拉远分离式ETC设备





