[发明专利]一种基于条件随机场和转换学习越南语组块方法在审
申请号: | 201610063505.1 | 申请日: | 2016-01-29 |
公开(公告)号: | CN105740233A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 余正涛;刘艳超;郭剑毅 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于条件随机场和转换学习越南语组块方法,属于自然语言处理技术领域。本发明包括步骤:首先对越南语语料进行预处理,得到句子级的越南语组块训练语料;从数据库中提取出句子级的越南语组块训练语料并对其进行组块建模,得到越南语组块条件随机场模型;获取转换方式集合;把待组块的越南语句子级测试语料通过已建好的越南语组块条件随机场模型和已获取的转换方式集合进行组块标记,得到越南语的组块标记结果。本发明对越南语句子实现了有效的组块分析,为短语树、语义分析和机器翻译等工作做铺垫;通过与现有的越南语组块工具比较,本文的越南语组块方法在准确率、召回率和F值都有明显的提高。 | ||
搜索关键词: | 一种 基于 条件 随机 转换 学习 越南语 方法 | ||
【主权项】:
一种基于条件随机场和转换学习越南语组块方法,其特征在于:所述基于条件随机场和转换学习越南语组块方法的具体步骤如下:Step1、首先对越南语语料进行预处理,得到句子级的越南语组块训练语料,作为标准的句子级的越南语组块训练语料,并把句子级的越南语组块语料保存到数据库中;Step2、从数据库中提取出句子级的越南语组块训练语料并对其进行组块建模,得到越南语组块条件随机场模型;Step3、用转换错误驱动学习方法对训练语料进行学习,获取转换方式集合;Step4、把待组块的越南语句子级测试语料通过已建好的越南语组块条件随机场模型和已获取的转换方式集合进行组块标记,得到越南语的组块标记结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610063505.1/,转载请声明来源钻瓜专利网。
- 上一篇:双转子破碎机承击砧
- 下一篇:一种环保型汽车发动机拨叉衬套