首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于多种损失融合文本分类模型结果的训练语料筛选方法在审

申请号：	202111341075.2	申请日：	2021-11-12
公开（公告）号：	CN114116969A	公开（公告）日：	2022-03-01
发明（设计）人：	徐泽坤;岳文浩	申请（专利权）人：	海信视像科技股份有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/335;G06F16/35
代理公司：	北京弘权知识产权代理有限公司 11363	代理人：	郭放;许伟群
地址：	266555 山东省青***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于多种损失融合文本分类模型结果训练语料筛选方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，包括：

将文本分类模型按照功能划分为模型层面和数据层面；

在所述模型层面，对所述文本分类模型进行多种损失函数融合，得到文本分类模型中训练样本数据的输出类别及类别概率值；

在所述数据层面，根据所述输出类别及所述类别概率值计算所述训练样本数据的方差；

筛选出待筛选回查数据，所述待筛选回查数据的方差低于方差阈值，所述方差阈值根据所述训练样本数据本身的输出类别预先设定。

2.根据权利要求1所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，所述多种损失函数融合基于全连接神经网络，所述多种损失函数融合是按照预设的融合方式对标签平滑损失函数、FocalLoss损失函数及对抗训练损失函数的融合。

3.根据权利要求2所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，对所述文本分类模型进行多种损失函数融合，得到输出类别及类别概率值，包括：

将训练样本数据输入所述文本分类模型中，得到过程类别及过程概率值；

根据所述过程类别及所述过程概率值计算各损失函数的过程损失值；

将所述过程损失值输入到所述全连接神经网络，得到最终损失值；

根据所述最终损失值训练所述文本分类模型，得到输出类别及类别概率值。

4.根据权利要求2所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，所述全连接神经网络为多层全连接。

5.根据权利要求1所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，还包括：

所述待筛选回查数据确定后，对所述待筛选回查数据进行回查处理，根据处理结果对所述文本分类模型进行再次训练。

6.根据权利要求1所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，通过如下公式计算所述训练样本数据的方差：

其中，x为所述训练样本数据的样本值，μ为全体样本值的平均数，n为样本数量。

7.根据权利要求1所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，所述类别概率值是经过归一化处理之后得到的。

8.根据权利要求1所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，还包括：

生成每个所述输出类别对应的问题样本，所述问题样本包含所述输出类别中所有的待筛选回查数据；

根据所述问题样本生成所述待筛选回查数据的标签对，将所有相同标签对的所述待筛选回查数据归为同一个标签对类，所述标签对类中包括两个所述输出类别；

计算所述标签对类中两个所述输出类别的混淆度；

如果所述混淆度低于混淆度阈值，所述标签对中存在输出类别的交叉。

9.根据权利要求8所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，根据所述问题样本生成所述待筛选回查数据的标签对，包括：

将所述待筛选回查数据按照预设的排序方式进行分类排序；

将前两个输出类别的所述待筛选回查数据组成标签对。

10.根据权利要求8所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，通过如下公式计算两个输出类别的混淆度：

其中，C₁，C₂分别是所述标签对中两个输出类别的样本数之和，K为C₁，C₂中所有问题样本的个数，σ为所述训练样本数据的方差。

11.根据权利要求8所述的基于多种损失融合文本分类模型结果的训练语料筛选方法，其特征在于，还包括，如果所述标签对存在输出类别的交叉，重新定义所述输出类别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司，未经海信视像科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111341075.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于量子粒子群优化的ECG信号监测方法
下一篇：一种预防配电柜火灾的预警装置

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top