[发明专利]一种基于Wide&Deep深度学习模型的文本预测方法有效

专利信息
申请号: 201911054827.X 申请日: 2019-10-31
公开(公告)号: CN110879934B 公开(公告)日: 2023-05-23
发明(设计)人: 傅啸 申请(专利权)人: 杭州电子科技大学
主分类号: G06F40/117 分类号: G06F40/117;G06F40/289;G06N3/0464;G06N3/08
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 杨舟涛
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 wide deep 深度 学习 模型 文本 预测 方法
【说明书】:

发明公开了一种基于WideDeep深度学习模型的文本预测方法。本发明旨在解决深度学习模型中对人工特征的充分利用以及WideDeep模型预测时的计算消耗问题。本发明的实施方案是:首先对文本数据进行标注,其次构建Wide特征,然后对基于WideDeep的深度学习模型添加辅助训练任务,最后对文本内容进行预测。本发明提及的人工特征作为深度学习模型训练过程中的附加任务,为模型提供了更多的有效信息,提高了模型学习效率。并且,在文本内容预测时不需要计算Wide特征,从而提升了模型性能。不同宽度的卷积核卷积后,可以通过一次卷积block获得不同距离上的信息,这有助于提升模型性能。同时,减少调整不同卷积核的时间,通过模型学习能自动适应不同的卷积核宽度。

技术领域

本发明涉及深度学习模型的一种基于WideDeep深度学习模型的文本预测方法,主要是深度学习模型的训练架构的设计方法。

背景技术

目前最主要的深度学习模型包括端到端的学习、人工特征、WideDeep模型。在WideDeep模型中,一般是先通过人工整理出有效的特征作为wide特征,以加速深度学习模型的训练速度,提高模型的性能。然后构建深度神经网络模型得到deep特征。最后计算wide特征和deep特征进行文本内容预测。但是,提取wide特征和deep特征是两个独立的过程,不能充分利用对方构建深度学习过程中的完整信息。并且在模型预测时需要先计算wide特征,再计算deep特征,使得模型的时效性较差。

发明内容

本发明旨在解决深度学习模型中对人工特征的充分利用以及WideDeep模型预测时的计算消耗问题。提出了一种基于WideDeep深度学习模型的文本预测方法。

本发明首先对文本数据进行标注,其次构建wide特征,然后对基于WideDeep的深度学习模型添加辅助训练任务,最后对文本内容进行预测。

本发明解决其技术问题所采用的技术方案如下:

步骤1:文本数据的预处理。

1-1.收集文本数据集X={x1,x2,…xN},N为总的训练样本数量。其中,xi∈{x1,x2,…xN},xi表示第i个待处理的文本数据。

1-2.利用人工对文本数据进行标记,针对文本数据集中每一个文本数据xi,标记对应的yi,yi∈{0,1}。标记文本数据的目的在于根据业务需要利用人工经验对文本数据进行分析,其中,1表示和业务相关,0表示不相关。

1-3.利用Jieba分词器对文本数据集X进行分词,汇总得到所有文本数据的词表W,W={w1,w2…,wD},其中D为词表的总长度。wk表示词表中第k个词。则文本数据xi可以表示为其中kn表示文本数据xi中第n个词在词表W中的序号,从而可用词表序号重新表示文本数据xi={k1,k2…,kn}。

步骤2:人工特征提取,构建wide特征。

2-1.统计文本数据集X中yi=1对应的所有文本数据xi中的词,得到出现频率最高的与业务相关的词,并排序获得序列Ⅰ;以及yi=0对应的所有文本数据xi中的词,得到出现频率最高的与业务不相关的词,并排序获得序列Ⅱ。

2-2.排除序列Ⅰ和序列Ⅱ中的语法型词汇,包括代词、冠词、连词等停用词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911054827.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top