[发明专利]通过多个语言任务层级处理数据的深度神经网络模型有效
| 申请号: | 201780068577.8 | 申请日: | 2017-11-03 |
| 公开(公告)号: | CN110192204B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 桥本和真;熊蔡明;R·佐赫尔 | 申请(专利权)人: | 硕动力公司 |
| 主分类号: | G06N3/0442 | 分类号: | G06N3/0442;G06F40/216;G06F40/284;G06F40/30;G06N3/045;G06N3/084 |
| 代理公司: | 北京市联德律师事务所 11361 | 代理人: | 黄大正;张来光 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 所公开的技术提供了所谓的“联合多任务神经网络模型”,以在单个端到端模型中使用不断增长的层深度来解决各种日益复杂的自然语言处理(NLP)任务。通过考虑语言层级,将词表示直接连接到所有模型层,明确地使用较低任务中的预测,并应用所谓的“连续正则化”技术来防止灾难性遗忘,来连续训练该模型。较低级模型层的三个示例是词性(POS)标注层、语块划分层和依赖性解析层。较高级模型层的两个示例是语义相关性层和文本蕴涵层。该模型实现了关于语块划分、依赖性解析、语义相关性和文本蕴涵的最先进的结果。 | ||
| 搜索关键词: | 通过 语言 任务 层级 处理 数据 深度 神经网络 模型 | ||
【主权项】:
1.一种用于处理输入语句中的词的神经网络系统的依赖性解析层组件;所述依赖性解析层叠加在产生语块标签嵌入和语块状态向量的语块标签嵌入层上;所述语块标签嵌入层又叠加在产生POS标签嵌入的POS标签嵌入层上;所述依赖解析层组件包括:依赖性父层和依赖性关系标签分类器;所述依赖性父层包括双向LSTM和一个或更多个分类器,具有嵌入处理模块、质量向量产生模块和父标签向量产生模块,所述嵌入处理模块用于处理词嵌入、POS标签嵌入、语块标签嵌入和语块状态向量,所述质量向量产生模块用于从所述双向LSTM产生的父标签状态向量产生父标签概率质量向量,所述父标签向量产生模块用于从所述父标签概率质量向量产生父标签嵌入向量;以及所述依赖性关系标签分类器包括归一化模块和依赖性标签向量产生模块,所述归一化模块用于对所述父标签状态向量和所述父标签嵌入向量进行缩放归一化,所述依赖性标签向量产生模块用于从所述父关系标签概率质量向量产生依赖性关系标签嵌入向量;以及输出处理器,至少输出所述依赖性关系标签嵌入向量或基于其的依赖性关系标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于硕动力公司,未经硕动力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780068577.8/,转载请声明来源钻瓜专利网。





