[发明专利]一种用于交通基础设施检测文本的机器阅读理解方法有效
| 申请号: | 202110711212.0 | 申请日: | 2021-06-25 |
| 公开(公告)号: | CN113312912B | 公开(公告)日: | 2023-03-31 |
| 发明(设计)人: | 杨建喜;向芳悦;李韧;李东;蒋仕新;刘新龙;王笛 | 申请(专利权)人: | 重庆交通大学 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30 |
| 代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 黄河 |
| 地址: | 400074 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 交通 基础设施 检测 文本 机器 阅读 理解 方法 | ||
1.一种用于交通基础设施检测文本的机器阅读理解方法,其特征在于,具体包括:
S1:获取问题文本和待检测的段落文本;
S2:将所述问题文本和所述段落文本输入经过预先训练的阅读理解模型中;
所述阅读理解模型首先对所述问题文本和所述段落文本进行编码得到对应的待检测字符向量;然后将所述待检测字符向量和设置的交通基础设施检测领域词向量进行融合得到对应的嵌入融合表示,并对所述嵌入融合表示进行语义特征捕捉;最后根据捕捉的语义特征计算对应答案在所述段落文本中的字符位置,并将对应答案的字符位置作为所述段落文本的机器阅读理解结果;
通过如下步骤计算对应答案在所述段落文本中的字符位置:
S221:根据捕捉的语义特征确定所述问题文本中问题的最终表示和所述段落文本中各个字符的最终表示;
S222:根据所述问题文本中问题的最终表示和所述段落文本中各个字符的最终表示计算对应答案的开始位置预测概率分数和结束位置预测概率分数;
S223:将开始位置预测概率分数取最大值时对应字符的位置作为对应答案的开始字符位置;将结束位置预测概率分数取最大值时对应字符的位置作为对应答案的结束字符位置;
S224:将对应答案的开始字符位置和结束字符位置作为所述段落文本的机器阅读理解结果;
通过star-transformer模型对所述待检测字符向量和所述交通基础设施检测领域词向量进行融合和语义特征捕捉;
S3:输出所述段落文本对应的机器阅读理解结果。
2.如权利要求1所述的用于交通基础设施检测文本的机器阅读理解方法,其特征在于,步骤S2中,通过如下步骤对所述问题文本和所述段落文本进行编码:
S201:分别对所述问题文本和所述段落文本进行字符序列化表示,得到对应的问题字符序列和段落字符序列;
S202:通过bert模型对所述问题字符序列和所述段落字符序列进行向量嵌入,得到对应的问题字符向量和段落字符向量;
S203:对整合所述问题字符向量和段落字符向量得到对应的待检测字符向量。
3.如权利要求2所述的用于交通基础设施检测文本的机器阅读理解方法,其特征在于:
问题字符序列表示为Q=[q1,q2,...,qm];式中:qi表示问题文本中的第i个字符;
段落字符序列表示为C=[d1,d2,...,dn];式中:di表示段落文本中的第i个字符;
整合时使用[SEP]作为分隔符,通过[[CLS]Q[SEP]C[SEP]]的形式构成待检测字符向量。
4.如权利要求1所述的用于交通基础设施检测文本的机器阅读理解方法,其特征在于,步骤S2中,通过如下步骤设置交通基础设施检测领域词向量:
S211:将已有的交通基础设施检测报告作为语料,并通过jieba分词的方式构建对应的交通基础设施检测领域词典;
S212:通过word2vec中的skip-gram模型对交通基础设施检测领域词典中的各个词进行词向量嵌入和词向量训练,得到对应的交通基础设施检测领域词向量。
5.如权利要求4所述的用于交通基础设施检测文本的机器阅读理解方法,其特征在于:步骤S212中,word2vec中的skip-gram模型通过如下步骤进行词向量训练:
将交通基础设施检测领域词典中的每个词表示成两个d维向量,分别作为中心词和背景词;
对中心词和背景词的向量做内积运算,并结合softmax函数计算中心词生成背景词的条件概率;
定义条件概率的损失函数并通过求导计算梯度的方式更新背景词的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆交通大学,未经重庆交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110711212.0/1.html,转载请声明来源钻瓜专利网。





