[发明专利]一种高速列车设计词库构建方法及构建系统在审
申请号: | 201910593391.5 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110347794A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 黎荣;丁雨秋;韩鑫;张义军;郑宇飞;丁国富 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 成都信博专利代理有限责任公司 51200 | 代理人: | 王沙沙 |
地址: | 610031 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高速列车设计词库构建方法及构建系统,包括以下步骤:步骤1:获取高速列车设计相关语料,统一文本格式;步骤2:对文本进行预处理,得到文本分词结果;步骤3:根据文本分词结果计算每个词的词语权重,权重大于设定阈值的为专业词汇;步骤4:确定专业词汇之间的语义关系;步骤5:若两个词汇之间存在同义关系和等级关系或相关度大于设定阈值,则将该专业词汇、词汇权重和语义关系存储在高速列车设计词库中,遍历文本分词结果中的所有词汇;本发明填补了目前高速列车设计领域内专业词库的空白,有效解决了传统人工构建词库方法效率低准确率低的问题;有利于高速列车设计制造企业的专业词汇组织、利用和更新维护。 | ||
搜索关键词: | 高速列车设计 专业词汇 词库 文本分词 构建 词汇 构建系统 语义关系 预处理 传统人工 等级关系 结果计算 同义关系 文本格式 有效解决 专业词库 权重和 相关度 准确率 遍历 权重 语料 词语 存储 文本 填补 更新 制造 统一 维护 | ||
【主权项】:
1.一种高速列车设计词库构建方法,其特征在于,包括以下步骤:步骤1:获取高速列车设计相关语料,统一文本格式;步骤2:对文本进行预处理,得到文本分词结果;步骤3:根据文本分词结果计算每个词的词语权重,权重大于设定阈值的为专业词汇;步骤4:确定专业词汇之间的语义关系,任选两个词汇确定其是否存在同义关系和等级关系,若不存在则计算其相关度;步骤5:若两个词汇之间存在同义关系和等级关系或相关度大于设定阈值,则将该专业词汇、词汇权重和语义关系存储在高速列车设计词库中,遍历文本分词结果中的所有词汇。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910593391.5/,转载请声明来源钻瓜专利网。