[发明专利]一种语义角色分析方法、计算机可读存储介质及终端设备有效
申请号: | 201810309685.6 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108804411B | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 张依;汪伟;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络模型 语义角色 词性分析 计算机可读存储介质 终端设备 分析 逆序 正序 计算机技术领域 分析效率 综合处理 计算量 输出 | ||
1.一种语义角色分析方法,其特征在于,包括:
对语句文本进行切词处理,得到构成所述语句文本的各个分词;
在预设的词向量数据库中分别查找各个分词的词向量,并根据所述词向量分别构建各个分词的第一输入矩阵和第二输入矩阵,所述词向量数据库为记录词语与词向量之间的对应关系的数据库;
将各个分词的第一输入矩阵分别输入到预设的第一神经网络模型中,得到各个分词的第一输出向量,所述第一神经网络模型为进行正序词性分析的神经网络模型;
将各个分词的第二输入矩阵分别输入到预设的第二神经网络模型中,得到各个分词的第二输出向量,所述第二神经网络模型为进行逆序词性分析的神经网络模型;
根据各个分词的第一输出向量和第二输出向量确定各个分词的词性类型;
在预设的词性向量数据库中分别查找各个分词的词性类型对应的词性向量,并根据所述词性向量分别构建各个分词的第三输入矩阵和第四输入矩阵,所述词性向量数据库为记录词性类型与词性向量之间的对应关系的数据库;
将各个分词的第三输入矩阵分别输入到预设的第三神经网络模型中,得到各个分词的第三输出向量,所述第三神经网络模型为进行正序语义角色分析的神经网络模型;
将各个分词的第四输入矩阵分别输入到预设的第四神经网络模型中,得到各个分词的第四输出向量,所述第四神经网络模型为进行逆序语义角色分析的神经网络模型;
根据各个分词的第三输出向量和第四输出向量确定各个分词的语义角色类型。
2.根据权利要求1所述的语义角色分析方法,其特征在于,所述根据所述词向量分别构建各个分词的第一输入矩阵和第二输入矩阵包括:
根据下式分别构建各个分词的第一输入矩阵:
其中,n为所述分词按照前后顺序依次排列的序号,1≤n≤N,N为所述语句文本的分词总数,cl为所述第一输入矩阵的行号,1≤cl≤CoupLen,CoupLen为预设的耦合长度,wvl为所述第一输入矩阵的列号,1≤wvl≤wVecLen,wVecLen为任意一个所述分词的词向量的长度,第n个分词的词向量为WordVecn,且WordVecn=(WdVecEmn,1,WdVecEmn,2,......,WdVecEmn,wvl,......,WdVecEmn,wVecLen),FwWdMatrixn为第n个分词的第一输入矩阵;
根据下式分别构建各个分词的第二输入矩阵:
BkWdMatrixn为第n个分词的第二输入矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810309685.6/1.html,转载请声明来源钻瓜专利网。