[发明专利]基于BiLSTM-CRF神经网络模型并融合越南语语言特征的名词短语识别方法在审
申请号: | 201810707821.7 | 申请日: | 2018-07-02 |
公开(公告)号: | CN109145286A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 郭剑毅;赵晨;余正涛;毛存礼;陈玮 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云南省昆明市五华区*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于BiLSTM‑CRF神经网络模型并融合越南语语言特征的名词短语识别方法,属于自然语言处理技术领域。本发明先收集已有语料,并对现有的语料库进行了预处理和扩展,构建名词短语语料库;根据构建的名词短语语料库,经过人工统计分析,得到名词短语的若干种形式,制定出若干种约束规则;构建BiLSTM‑CRF模型,使用训练语料对模型进行训练,用于越南语名词短语识别;在构建的BiLSTM‑CRF模型输出层加入制定的约束规则,获得最终的识别结果。本发明对越南语名词短语实现了有效的识别,提升实体识别、搜索引擎等应用的准确率。 | ||
搜索关键词: | 名词短语 越南语 构建 名词短语识别 语料库 神经网络模型 语言特征 约束规则 自然语言处理技术 预处理 实体识别 搜索引擎 训练语料 统计分析 融合 输出层 准确率 语料 制定 应用 | ||
【主权项】:
1.基于BiLSTM‑CRF神经网络模型并融合越南语语言特征的名词短语识别方法,其特征在于:所述方法的具体步骤如下:Step1、收集已有语料,并对现有的语料库进行了预处理和扩展,构建名词短语语料库;Step2、根据构建的名词短语语料库,经过人工统计分析,得到名词短语的若干种形式,制定出若干种约束规则;Step3、构建BiLSTM‑CRF模型,使用训练语料对模型进行训练,用于越南语名词短语识别;Step4、在构建的BiLSTM‑CRF模型输出层加入制定的约束规则,获得最终的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810707821.7/,转载请声明来源钻瓜专利网。
- 上一篇:短语提取文本分析方法和系统
- 下一篇:印尼语单词检错纠错方法及系统