[发明专利]一种文稿生成方法与装置在审
申请号: | 202210873231.8 | 申请日: | 2022-07-22 |
公开(公告)号: | CN115114892A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 刘启芳;赵志强;薛建军;刘俊;王静;曾勇;郑晶晶 | 申请(专利权)人: | 武汉烽火技术服务有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/205;G06F40/117;G06F16/33 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430205 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文稿 生成 方法 装置 | ||
本发明提供一种文稿生成方法与装置,根据现有的课件文稿自动生成讲义文稿;将现有的课件文稿进行识别分类,分为结构页与内容页,对结构页与内容页进行解析,并依赖过往课件建立的语料库,训练对应模型,通过模型根据结构页生成讲义提纲,通过模型根据内容页生成讲义内容,即得到讲义文稿。
技术领域
本发明属于数字化培训资源生成领域,更具体地,涉及一种文稿生成方法与装置。
背景技术
随着互联网、通信等领域的设备集成化和智能化程度的不断提升,ICT领域面向运维和管理人员的职业技能培训日趋重要和复杂。在实际培训中,由于技术的复杂性和多样性,参训人员的培训需求差异化,我们需要为每个培训项目定制开发培训方案,其中一项主要工作即定制培训课件以及对应的课件讲义。
课件讲义是培训课件对应的详细文字内容。在形式上,培训课件(如PowerPoint演示文稿)多用于展示短句形式的知识要点,而知识要点对应的详细内容则通过培训讲师口头讲述。培训讲师口头讲述内容即为本案所述的课件讲义。在实际操作中,人们通常更加注重培训课件的制作,对于课件讲义的内容制作往往缺乏足够的关注,多数情况下是由培训讲师根据自身对课件内容的理解来自由编写讲义内容。一方面,该项工作耗费了大量的人力资源;另一方面,由于培训讲师的知识背景和个性差异,导致不同培训讲师编写的课件讲义质量参差,最终影响培训效果。
因此,急需一种文稿自动生成方法,以便快速高效的生成与课件文稿相对应的讲义文稿,降低人力成本,提升培训资源质量。
发明内容
本发明要解决的技术问题是缺乏通过课件文稿自动生成讲义文稿的方法,人为依据课件来对讲义文稿进行编写过于耗费人力资源,且编写出的讲义文稿质量参差。
第一方面,一种文稿生成方法,根据课件文稿生成讲义文稿,包括:
将课件文稿输入并分为结构页和内容页,对所述结构页和所述内容页进行解析,而后根据由往期课件建立的语料库,对应训练讲义提纲生成模型和讲义内容检索模型,通过所述讲义提纲生成模型根据结构页解析得到的结构文本生成讲义提纲,通过所述讲义内容检索模型根据内容页解析得到的内容文本生成讲义内容;
所述讲义提纲加上所述讲义内容即为讲义文稿。
优选的,所述将课件文稿输入并分为结构页和内容页,具体包括:
在所述课件文稿输入后,获取课件文稿的页面编号和页面内容,根据所述页面编号和所述页面内容将所述课件文稿分为首页、目录页、正文页和结束页中的至少两种;
将所述首页、目录页和结束页识别为课件文稿的结构页,将所述正文页识别为课件文稿的内容页。
优选的,所述将所述首页、目录页和结束页识别为课件文稿的结构页,具体包括:
所述结构页按照其在所述课件文稿中的位序排列形成结构页集合S,所述结构页集合S的文本内容即为结构文本Stext;
所述结构文本Stext为:
所述Spid为结构单元,具体为:
Spid=(titlepid,contentpid,notepid);
其中,所述pid为页面编号,所述titlepid为标题文本,所述contentpid为正文文本,所述notepid为备注文本,所述Ps为结构页的页面编号pid集合。
优选的,所述将所述正文页识别为课件文稿的内容页,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火技术服务有限公司,未经武汉烽火技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210873231.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:表面清洁设备
- 下一篇:一种市政给排水施工用防塌落装置