[发明专利]一种端到端的藏文La格浅层语义分析方法有效

专利信息
申请号: 202210602138.3 申请日: 2022-05-30
公开(公告)号: CN115510869B 公开(公告)日: 2023-08-01
发明(设计)人: 班玛宝;才让加;张瑞;慈祯嘉措;桑杰端珠;杨毛加 申请(专利权)人: 青海师范大学
主分类号: G06F40/30 分类号: G06F40/30;G06N3/045;G06N3/0442;G06N3/047;G06N3/048
代理公司: 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 代理人: 李英
地址: 810016 青*** 国省代码: 青海;63
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 端到端 藏文 la 格浅层 语义 分析 方法
【说明书】:

发明涉及藏文La格浅层语义分析技术领域,涉及一种端到端的藏文La格浅层语义分析方法,包括:一、将输入以词为单元的特征序列和对应的标记序列映射成低维实值向量;二、在LSTM的垂直方向上装置门控高速连接机制GM,采用BiLSTM学习输入句子的时序特征和上下文语义信息;GM包含对单元内部输入和输出的线性连接,使信息可以通畅地在不同层之间传播;三、使用softmax计算每一时刻语义标签的局部归一化分布,以供输出层进行约束解码;四、使用维特比算法进行解码时通过强制执行设定的BIO和La格浅层语义标注约束,规范输出语义标签之间的结构关系。本发明能较佳地进行藏文La格浅层语义分析。

技术领域

本发明涉及藏文La格浅层语义分析技术领域,具体地说,涉及一种端到端的藏文La格浅层语义分析方法。

背景技术

藏文La格浅层语义分析的目标是首先找出给定句子的谓词,然后以该谓词为核心,确定相关的主要语义成分,并标记相应的语义标签,进而得到给定句子的类型及各语义成分所充当的语义角色。

La格是藏文语法典籍《三十颂》和《音势论》中的重点和难点,也是八格中的主要研究内容,所以面向自然语言处理,研究基于机器学习方法的藏文La格浅层语义分析技术可以对很多上层藏语自然语言理解任务起到帮助作用,比如语义角色标注、语义分析、信息抽取、自动问答、阅读理解、机器翻译等。此外,La格是藏语文课本中必学的一个重点知识,唯有熟练掌握其概念和用法,才能准确区分藏文La的类型,找准每个句子的主要语义成分,并进一步分析每个句子的实际含义。可见研究基于机器学习方法的藏文La格浅层语义分析技术在La格的学习中也具备一定的实际应用价值。

传统的浅层语义分析任务与句法分析密切相关,严重依赖于句法分析结果,这导致增加了浅层语义分析的复杂性。近几年,随着深度学习技术的不断成熟,没有句法输入的端到端的模型在浅层语义分析任务上取得了很好的结果。有文献研究了端到端的LSTM浅层语义分析方法,取得了优于传统引入句法信息方法的效果,这些端到端模型的成功揭示了LSTM处理句子潜在句法结构的潜在能力,也为进一步研究和改进提供了理论基础和参考依据。目前,尚未查阅到有关基于端到端模型的藏文浅层语义分析方法,更未见到有关La格浅层语义分析的文献报道。

发明内容

本发明的内容是提供一种端到端的藏文La格浅层语义分析方法,其能够克服现有技术的某种或某些缺陷。

根据本发明的一种端到端的藏文La格浅层语义分析方法,其包括以下步骤:

一、将输入以词为单元的特征序列和对应的标记序列映射成低维实值向量;

二、在LSTM的垂直方向上装置门控高速连接机制GM,采用BiLSTM学习输入句子的时序特征和上下文语义信息;GM包含对单元内部输入和输出的线性连接,使信息可以通畅地在不同层之间传播;

三、使用softmax计算每一时刻语义标签的局部归一化分布,以供输出层进行约束解码;

四、使用维特比算法进行解码时通过强制执行设定的BIO和La格浅层语义标注约束,规范输出语义标签之间的结构关系。

作为优选,步骤一中,用表示已训练好的GloVe词向量,用V表示词汇表,用C∈{0,1}表示标记集合,则最原始的输入序列{w1,w2,…,wT}和标记序列{m1,m2,…,mT}通过查找表lookuptable映射成低维实值向量e(wt)和e(mt),其中wt∈V和对应标记mt∈C;至此,可将向量e(wt)和e(mt)拼接成xl,t作为LSTM第一层的输入:

xl,t=[e(wt),e(mt)]

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青海师范大学,未经青海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210602138.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top