[发明专利]一种高速列车设计词库构建方法及构建系统在审

专利信息
申请号: 201910593391.5 申请日: 2019-07-03
公开(公告)号: CN110347794A 公开(公告)日: 2019-10-18
发明(设计)人: 黎荣;丁雨秋;韩鑫;张义军;郑宇飞;丁国富 申请(专利权)人: 西南交通大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/36
代理公司: 成都信博专利代理有限责任公司 51200 代理人: 王沙沙
地址: 610031 四川省成都市*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种高速列车设计词库构建方法及构建系统,包括以下步骤:步骤1:获取高速列车设计相关语料,统一文本格式;步骤2:对文本进行预处理,得到文本分词结果;步骤3:根据文本分词结果计算每个词的词语权重,权重大于设定阈值的为专业词汇;步骤4:确定专业词汇之间的语义关系;步骤5:若两个词汇之间存在同义关系和等级关系或相关度大于设定阈值,则将该专业词汇、词汇权重和语义关系存储在高速列车设计词库中,遍历文本分词结果中的所有词汇;本发明填补了目前高速列车设计领域内专业词库的空白,有效解决了传统人工构建词库方法效率低准确率低的问题;有利于高速列车设计制造企业的专业词汇组织、利用和更新维护。
搜索关键词: 高速列车设计 专业词汇 词库 文本分词 构建 词汇 构建系统 语义关系 预处理 传统人工 等级关系 结果计算 同义关系 文本格式 有效解决 专业词库 权重和 相关度 准确率 遍历 权重 语料 词语 存储 文本 填补 更新 制造 统一 维护
【主权项】:
1.一种高速列车设计词库构建方法,其特征在于,包括以下步骤:步骤1:获取高速列车设计相关语料,统一文本格式;步骤2:对文本进行预处理,得到文本分词结果;步骤3:根据文本分词结果计算每个词的词语权重,权重大于设定阈值的为专业词汇;步骤4:确定专业词汇之间的语义关系,任选两个词汇确定其是否存在同义关系和等级关系,若不存在则计算其相关度;步骤5:若两个词汇之间存在同义关系和等级关系或相关度大于设定阈值,则将该专业词汇、词汇权重和语义关系存储在高速列车设计词库中,遍历文本分词结果中的所有词汇。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910593391.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top