[发明专利]一种半结构化文本处理及分析方法在审
| 申请号: | 202010771936.X | 申请日: | 2020-08-04 |
| 公开(公告)号: | CN111881298A | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 杨帆;邱才明;密铁宾 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06Q10/06;G06Q10/00 |
| 代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 结构 文本 处理 分析 方法 | ||
1.一种半结构化文本处理及分析方法,其特征在于,所述文本处理及分析方法包括:
将树状语义信息转换为词向量;
将所述词向量拼接为语义矩阵;
输入所述语义矩阵对双向长短期记忆网络按训练标签进行分类训练;
根据所述训练标签,所述双向长短期记忆网络的分类器输出设备状态预测结果。
2.如权利要求1所述的一种半结构化文本处理及分析方法,其特征在于,所述将树状语义信息转换为词向量之前还包括半结构化文本预处理:
参照领域本体及知识获取粒度定义知识抽取规则;
根据所述知识抽取规则对所述半结构化文本进行知识抽取生成所述树状语义信息。
3.如权利要求2所述的一种半结构化文本处理及分析方法,其特征在于,根据工程需求及计算资源来确定所述知识获取粒度。
4.如权利要求2所述的一种半结构化文本处理及分析方法,其特征在于,所述树状语义信息包括:设备性能参数,检验项目及内容,检验结果及结论。
5.如权利要求1所述的一种半结构化文本处理及分析方法,其特征在于,所述训练标签包括:健康状态,一般缺陷状态,重要缺陷状态及紧急缺陷状态。
6.如权利要求1-5任一项所述的一种半结构化文本处理及分析方法,其特征在于,在所述输出设备状态预测结果之后还包括:
设置所述训练标签各状态权重,所述权重包括:健康状态权重,一般缺陷状态权重,重要缺陷状态权重及紧急缺陷状态权重;
所述分类器输出所述训练标签各状态概率,所述概率包括:健康状态概率,一般缺陷状态概率,重要缺陷状态概率及紧急缺陷状态概率;
根据所述权重和所述概率获取健康指数;
根据所述健康指数所属的状态区间评估所述设备状态。
7.如权利要求6所述的一种半结构化文本处理及分析方法,其特征在于,所述状态区间包括:健康状态区间,一般缺陷状态区间,重要缺陷状态区间及紧急缺陷状态区间,各所述区间由训练集中处于某同一状态的多台设备的所述健康指数构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010771936.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制备次氯酸水的控制方法
- 下一篇:一种靠背与座架联动式新型座椅





