[发明专利]一种公文模板推荐方法及系统在审
| 申请号: | 202111105392.4 | 申请日: | 2021-09-22 |
| 公开(公告)号: | CN113836884A | 公开(公告)日: | 2021-12-24 |
| 发明(设计)人: | 周剑明;林俊德;陈立峰;林诚汉 | 申请(专利权)人: | 福建新大陆软件工程有限公司 |
| 主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/289;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 福州市鼓楼区京华专利事务所(普通合伙) 35212 | 代理人: | 林燕 |
| 地址: | 350000 福建省福州*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 公文 模板 推荐 方法 系统 | ||
本发明提供了公文处理技术领域的一种公文模板推荐方法及系统,方法包括如下步骤:步骤S10、获取公文历史数据,并对所述公文历史数据进行预处理;步骤S20、创建一公文模板抽取模型,利用所述公文模板抽取模型从公文历史数据中抽取若干个公文模板;步骤S30、创建并训练一用于匹配所述公文模板与公文标题的公文模板匹配模型;步骤S40、获取用户输入的新公文标题,基于所述新公文标题以及公文模板匹配模型匹配对应的公文模板,完成公文模板推荐。本发明的优点在于:极大的提升了公文写作的效率以及质量。
技术领域
本发明涉及公文处理技术领域,特别指一种公文模板推荐方法及系统。
背景技术
公文写作有其独特的写作格式及写作内容,严谨专业的写作格式可以反映出写作者对业务的熟悉程度,更可以让公文内容高效地发挥其应有的信息传递效用;写作者需要长期保持对相关领域更新内容的持续学习输入和写作输出,才能保障写作内容的质量。
当前,在公文写作过程中,经常存在调整格式复杂、写作素材难寻以及文字校对易疏漏等痛点,写作者常常需要耗费大量时间在格式排版和内容写作上,导致公文处理效率低下,进而导致工作事务处理不及时,影响企业机构运转的整体效率,增加企业的人工成本。
因此,如何提供一种公文模板推荐方法及系统,实现提升公文写作的效率以及质量,成为一个亟待解决的问题。
发明内容
本发明要解决的技术问题,在于提供一种公文模板推荐方法及系统,实现提升公文写作的效率以及质量。
第一方面,本发明提供了一种公文模板推荐方法,包括如下步骤:
步骤S10、获取公文历史数据,并对所述公文历史数据进行预处理;
步骤S20、创建一公文模板抽取模型,利用所述公文模板抽取模型从公文历史数据中抽取若干个公文模板;
步骤S30、创建并训练一用于匹配所述公文模板与公文标题的公文模板匹配模型;
步骤S40、获取用户输入的新公文标题,基于所述新公文标题以及公文模板匹配模型匹配对应的公文模板,完成公文模板推荐。
进一步地,所述步骤S10具体为:
从公文数据库中获取公文历史数据,并对所述公文历史数据进行包括数据清洗和数据标准化的预处理;
所述公文历史数据至少包括公文ID、部门ID、公文标题、正文、发送者、接收者、接收时间以及处理时间;
所述数据清洗具体为对所述公文历史数据进行有效性校验、剔除非法字符以及公文去重;
所述数据标准化具体为对所述公文历史数据进行公文编码、公文格式以及公文类型的统一。
进一步地,所述步骤S20具体为:
基于神经网络创建一公文模板抽取模型,利用预处理后的所述公文历史数据,对所述公文模板抽取模型进行包括预训练和微调的范式训练;
利用训练后的所述公文模板抽取模型从公文历史数据中抽取若干个公文模板,并将各所述公文模板存储至模板数据库。
进一步地,所述步骤S30具体为:
基于神经网络创建一用于匹配所述公文模板与公文标题的公文模板匹配模型,从所述公文历史数据中提取若干个公文标题组成公文标题训练集,利用所述公文标题训练集对公文模板匹配模型进行包括预训练和微调的范式训练。
进一步地,所述步骤S40具体为:
获取用户输入的新公文标题,利用BM25算法匹配所述新公文标题以及公文历史数据中的公文标题,进行筛选出相似度最高的N个公文标题,将各相似度最高的所述公文标题分别输入公文模板匹配模型匹配对应的公文模板,完成公文模板推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建新大陆软件工程有限公司,未经福建新大陆软件工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111105392.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种陶瓷生产用石英粉调配工艺
- 下一篇:基于导航定位的分布检测系统





