[发明专利]基于注意力机制的BiGRU判决结果倾向性分析方法在审
申请号: | 201811166731.8 | 申请日: | 2018-10-08 |
公开(公告)号: | CN111027313A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 王宁;周晓磊;李世林;刘堂亮;张镝;祁柏林;赵奎 | 申请(专利权)人: | 中国科学院沈阳计算技术研究所有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 李巨智 |
地址: | 110168 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 bigru 判决 结果 倾向性 分析 方法 | ||
本发明涉及一种基于注意力机制的BiGRU判决结果倾向性分析方法,抽取待分析的裁判文书的当事人关键词信息以及判决结果关键词信息;将判决结果切分为若干单句,并对每条单句进行分词和去除停用词处理,得到词序列;构建词向量表,并利用词向量表将词序列表示为对应的词向量矩阵;将词向量矩阵进行BiGRU计算,得到词向量矩阵的特征向量,在对词向量矩阵的特征向量进行注意力计算,得到注意力机制的输出向量;将注意力机制的输出向量利用softmax进行分类。本发明提高算法的准确度,使得分类结果更加精确,弥补了传统的基于单向神经网络对文本上下文语境的忽略,提高了情感分类结果精确度,能够对文本中的关键信息强化有很好的效果,提高了算法的准确度。
技术领域
本发明涉及深度学习和自然语言处理领域,具体地说是一种基于注意力机制的BiGRU判决结果倾向性分析方法。
背景技术
在现代信息技术的发展以及法制建设的深化,随着大量裁判文书的公开,从海量的裁判文书中发掘知识变得更加有意义。文本情感分析:又称意见挖掘、倾向性分析等,简单而言,是对主观性文本进行分析、处理、归纳和推理的过程。文本情感分析领域的研究中主流的算法以深度学习最为流行。
随着文本情感分析的发展,将其应用到判决结果倾向性分析中是必然的趋势。目前的文本情感分析的算法应用在判决结果倾向性分析的研究中由于信息的损失导致倾向性分析的准确性有所降低,且计算比较复杂,从一定程度上制约了情感分析的效率。
针对目前在判决结果倾向性分析研究中的问题,本文提出了一种注意力机制的BiGRU判决结果倾向性分析方法,以提高判决结果倾向性分析的准确性,和提升判决结果倾向性的效率。
发明内容
针对现有技术的不足,本发明提供一种基于注意力机制的BiGRU判决结果倾向性分析方法,解决了判决结果中的倾向性分析中由于信息损失而导致分类准确率降低的问题,提升了判决结果倾向性分析计算的效率。
本发明为实现上述目的所采用的技术方案是:
一种基于注意力机制的BiGRU判决结果倾向性分析方法,
抽取待分析的裁判文书的当事人关键词信息以及判决结果关键词信息;
将判决结果切分为若干单句,并对每条单句进行分词和去除停用词处理,得到词序列;
构建词向量表,并利用词向量表将词序列表示为对应的词向量矩阵;
将词向量矩阵进行BiGRU计算,得到词向量矩阵的特征向量,在对词向量矩阵的特征向量进行注意力计算,得到注意力机制的输出向量;
将注意力机制的输出向量利用softmax进行分类。
所述当事人关键词信息包括原告、被告、上诉人、被上诉人、申请人、被申请人。
所述判决结果关键词信息包括“判决如下:”、“裁决如下:”、“裁定如下:”、“判定如下:”。
如果判决结果中没有当事人的标准法律称谓,则将当事人的非标准法律称谓替换成对应当事人的标准法律称谓,具体包括:
所述构建词向量表包括以下过程:
通过对裁判文书训练集进行去除停用词、分词处理,生成构建词向量所需要的语料;对语料生成第一词汇表,统计每个词的词频并排序,取词频最大的V个词,构成第二词汇表;
第二词汇表中的每个词用其对应的one-hot向量表示,且每个词对应的one-hot向量的维度是V,生成one-hot向量表;
利用Skip-gram模型对one-hot向量表进行降维,生成词向量表。
所述词向量矩阵表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳计算技术研究所有限公司,未经中国科学院沈阳计算技术研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811166731.8/2.html,转载请声明来源钻瓜专利网。
- 基于Smi2Vec的BiGRU药物毒性预测系统及预测方法
- 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置
- 一种基于ERNIE-BiGRU的中文文本分类方法
- 基于深度学习的预测化合物蛋白质亲和力新型编码方案、计算机设备、存储介质
- 一种基于BiGRU的智能电表计量模块故障预测与诊断方法
- 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
- 一种预测化合物蛋白质亲和力的新型深度学习模型、计算机设备、存储介质
- 基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
- 一种基于ATAE-BiGRU的文本方面情感分类方法及系统
- 一种基于自注意力机制和BiGRU的文本分类方法