[发明专利]读法预测模型获取及读法预测方法、装置及存储介质有效

专利信息
申请号: 201911069834.7 申请日: 2019-11-05
公开(公告)号: CN111061868B 公开(公告)日: 2023-05-23
发明(设计)人: 白洁;王毅;潘政林;陈昌滨;聂志朋;高占杰 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F18/2411;G06F18/214
代理公司: 北京鸿德海业知识产权代理有限公司 11412 代理人: 田宏宾
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 读法 预测 模型 获取 方法 装置 存储 介质
【说明书】:

本申请公开了读法预测模型获取及读法预测方法、装置及存储介质,涉及深度学习领域,其中的读法预测模型获取方法可包括:利用第一训练样本集训练得到语言模型,语言模型中至少包含两层多头注意力层;利用语言模型及分类器构成读法预测模型,并利用第二训练样本集训练读法预测模型,以便针对待预测的输入文本,预测出其中的预定类型字符的读法分类。应用本申请所述方案,可提升预测结果的准确性等。

技术领域

本申请涉及计算机应用领域,特别涉及深度学习领域的读法预测模型获取及读法预测方法、装置及存储介质。

背景技术

在实际应用中,某些场景下需要对输入文本中的数字字符读法进行预测,如“打110报警电话”和“打110多个报警电话”,其中的“110”的读法明显是不同的。

传统方式中,多采用卷积神经网络(CNN,Convolutional Neural Network)或长短时记忆网络(LSTM,Long Short-Term Memory)等序列分类或标注模型来进行预测,但此类模型所能获取到的信息(如语义信息)有限,因此预测结果的准确性通常较低。

发明内容

有鉴于此,本申请提供了读法预测模型获取及读法预测方法、装置及存储介质。

一种读法预测模型获取方法,包括:

利用第一训练样本集训练得到语言模型,所述语言模型中至少包含两层多头注意力层;

利用所述语言模型及分类器构成读法预测模型,并利用第二训练样本集训练所述读法预测模型,以便针对待预测的输入文本,预测出其中的预定类型字符的读法分类。

根据本申请一优选实施例,所述利用第一训练样本集训练得到语言模型包括:所述语言模型以基于转换器的双向编码表示BERT为基础,采用字词混掩码训练方式。

根据本申请一优选实施例,所述语言模型中包含依次叠加的词向量层以及第一多头注意力层~第N多头注意力层,N为大于一的正整数;

其中,所述词向量层用于获取输入文本的词向量表示,输出给所述第一多头注意力层;每一层多头注意力层分别以下一层的输出作为输入;所述第N多头注意力层的输出包含所述输入文本中的每个字符在高维空间的向量表示。

根据本申请一优选实施例,所述预定类型字符包括:数字字符;

所述读法预测模型的输出包括:所述输入文本中的每组数字字符分别属于预定义的不同读法的概率。

根据本申请一优选实施例,所述第二训练样本集中的训练样本数小于所述第一训练样本集中的训练样本数。

一种读法预测方法,包括:

获取待预测的输入文本;

将所述输入文本输入预先训练得到的读法预测模型,得到预测出的所述输入文本中的预定类型字符的读法分类;其中,所述读法预测模型由语言模型和分类器构成,所述语言模型中至少包含两层多头注意力层。

根据本申请一优选实施例,所述语言模型以基于转换器的双向编码表示BERT为基础,采用字词混掩码训练方式训练得到。

根据本申请一优选实施例,所述语言模型中包含依次叠加的词向量层以及第一多头注意力层~第N多头注意力层,N为大于一的正整数;

其中,所述词向量层用于获取输入文本的词向量表示,输出给所述第一多头注意力层;每一层多头注意力层分别以下一层的输出作为输入;所述第N多头注意力层的输出包含所述输入文本中的每个字符在高维空间的向量表示。

根据本申请一优选实施例,所述预定类型字符包括:数字字符;

所述读法预测模型的输出包括:所述输入文本中的每组数字字符分别属于预定义的不同读法的概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911069834.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top