[发明专利]一种基于反馈自学习的动态字典库生成方法在审
申请号: | 202110321491.X | 申请日: | 2021-03-25 |
公开(公告)号: | CN113761215A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 赵忠华;李建广;余智华;王禄恒;陈欣洁;赵志云;冯凯;葛自发;杜漫;孙小宁;穆庆伟;万欣欣;申双成;李欣;孙立远;付培国;王晴;杜宛真 | 申请(专利权)人: | 中科天玑数据科技股份有限公司;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/242;G06F40/295 |
代理公司: | 天津津中今知识产权代理有限公司 12252 | 代理人: | 韩学琴 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于反馈自学习的动态字典库生成方法,包括以下步骤:S1、字典库定义;S2、基于字典库分类体系;S4、基于语料库导出的标注数据,配合模型参数调整,逐步迭代优化模型;S5、将S4步生成的预测数据回填到字典库。有益效果:该方法通过概念模式定义、自然语言处理技术、全流程调度机制,实现从原始语料概念模式定义生成基础字典库,在基础字典库基础上进行标注模型的自动构建、迭代训练及修正,最后再利用标注模型来进行新的语料数据标注,反馈更新字典库,实现从标注训练到反馈自学习的闭环流程,达到模型自动逐步优化能力。最终实现字典库的自动完善,标注模型逐步优化的全自动循环过程。 | ||
搜索关键词: | 一种 基于 反馈 自学习 动态 字典 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科天玑数据科技股份有限公司;国家计算机网络与信息安全管理中心,未经中科天玑数据科技股份有限公司;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110321491.X/,转载请声明来源钻瓜专利网。