[发明专利]基于共享表示的多任务语言分析系统及方法有效
| 申请号: | 201910600598.0 | 申请日: | 2019-07-04 |
| 公开(公告)号: | CN110309511B | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 车万翔;刘洋;赵妍妍;刘挺 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
| 地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 基于共享表示的多任务语言分析系统及方法,属于语言分析技术领域。本发明是为了解决目前的语言分析方法存在分析速度慢以及分析准确率低的问题。本发明通过神经网络模型来完成对多个单句文本分析任务处理。这些任务包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注。每个任务模块都包含一个独立的子模型,这些子模型的结构各不相同,将在下文逐一解释。同时,模型需要一个共享的表示层模块。主要用于语言的分析。 | ||
| 搜索关键词: | 基于 共享 表示 任务 语言 分析 系统 方法 | ||
【主权项】:
1.基于共享表示的多任务语言分析系统,其特征在于,包括:表示层模型:表示层模型使用的是BERT编码器结构的隐层输出,该模型输入中文字序列,输出与字序列等长的向量序列,每个向量对应着相应位置的字的分布式语义表示,将表示层输出统一表示为矩阵R1;分词模块:针对R1中每个字隐层表示的向量通过一个线性层运算,映射到一个4维的BMES标签空间,使用softmax函数转化为标签概率分布,求出概率最高的标签,并通过标签含义,解码出词序列输出;以词序列和R1作为输出,将R1中每个词首字位置的隐层表示输出作为该词的分布式表示,统一表示为R2;分析模块,包括词性标注子模块;每个子模块的输入均为分词模块的输出结果R2;词性标注子模块:针对R2中每个词隐层表示向量通过一个线性层运算,映射到词性标签空间,使用softmax函数转化为词性概率分布,求出概率最高的词性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910600598.0/,转载请声明来源钻瓜专利网。





