[发明专利]一种基于迁移学习的缺陷报告跨项目分类方法在审
| 申请号: | 201810601343.1 | 申请日: | 2018-06-12 |
| 公开(公告)号: | CN108984613A | 公开(公告)日: | 2018-12-11 |
| 发明(设计)人: | 郑征;杜晓婷;肖冠平 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 王顺荣;唐爱华 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 缺陷报告 项目分类 迁移 目标数据 训练数据 语义模型 自动分类 分类器 源数据 准确率 预处理 学习 测试数据 分类结果 机器学习 计算步骤 数据训练 向量表示 选择数据 语义信息 引入 权重 | ||
1.一种基于迁移学习的缺陷报告跨项目分类方法,其特征在于:该方法包括以下步骤:
步骤1)、明确所要分类的目标数据,根据目标数据的特点选择与之有相近特征的源数据,并对目标数据和源数据均进行文本预处理;
步骤2)、训练缺陷报告语义模型,使用大量的无标签的缺陷报告训练缺陷报告语义模型,得到每个单词的向量表示,并将步骤1)源数据和目标数据中的每个缺陷报告都表示成向量的形式;
步骤3)、将步骤2)中的得到的源数据和目标数据划分成训练数据和测试数据,其中训练数据包括所有的源数据和10%~20%的目标数据,测试数据包括其余的目标数据;对训练数据赋予初始权重,通过迁移学习不断调整训练数据的权重,使对目标数据的分类误差最小;
步骤4)、使用步骤3)中迁移得到的训练数据训练机器学习分类器,并使用机器学习分类器对测试数据进行自动分类,得到缺陷报告的跨项目分类结果。
2.根据权利要求1所述的一种基于迁移学习的缺陷报告跨项目分类方法,其特征在于:步骤1)中所述的预处理包括分词、移除停用词和词形还原,排除文本中包含的干扰信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810601343.1/1.html,转载请声明来源钻瓜专利网。





