[发明专利]一种基于树库转化的越南语依存树库错误检测的方法在审
申请号: | 201810021822.6 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108280060A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 郭剑毅;邱国柯;余正涛;线岩团;毛存礼 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 越南语 错误检测 短语类型 规则知识库 短语结构 树库转化 依存结构 推导 自然语言处理技术 机器翻译 测试 人力物力 上层应用 信息抽取 信息检索 依存关系 父节点 子节点 构建 转化 支撑 成功 | ||
1.一种基于树库转化的越南语依存树库错误检测的方法,其特征在于:所述方法的具体步骤如下:
Step1、首先定义越南语的依存关系类型;
Step2、其次利用Step1的结果构建一个规则知识库,并利用该规则知识库推导出测试依存结构树中父节点和子节点构成的短语类型;
Step3、然后将测试依存结构树转化为短语结构树;若转化失败,则直接说明测试依存结构树中最基础的分词与词性标注错误;若转化成功,则进入Step4;
Step4、最后将Step3中实际转化成功得到的短语结构树的短语类型与Step2中推导出的短语类型进行对比;若对比一致,则说明测试依存结构树不存在错误;若对比不一致,则说明测试依存结构树中最基础的分词与词性标注正确,而更上层的依存关系标注错误。
2.根据权利要求1所述的基于树库转化的越南语依存树库错误检测的方法,其特征在于:所述步骤Step1的具体步骤为:
Step1.1、首先依据语义方式找出句子中哪些词语之间存在依存关系;
Step1.2、其次依据主干方式找出句子中哪些词语与谓词之间存在依存关系;
Step1.3、最后归类出Step1.1和Step1.2中所找出词语之间具体属于哪一种依存关系类型。
3.根据权利要求1所述的基于树库转化的越南语依存树库错误检测的方法,其特征在于:所述步骤Step2中,构建一个规则知识库的具体步骤如下:
Step2.1、首先定义规则知识库的具体框架;
Step2.2、然后自动抽取条件库;遍历依存树库中每一棵依存树,并将树中每一条弧线关联的父节点词性、子节点词性以及它们之间的依存关系类型都一一抽取出来,将它们组合在一起就构成了条件库;
Step2.3、最后人工辅助添加结论。
4.根据权利要求1所述的基于树库转化的越南语依存树库错误检测的方法,其特征在于:所述步骤Step3中,依据中心子节点的思想、递归算法将越南语的依存结构树转化成短语结构树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810021822.6/1.html,转载请声明来源钻瓜专利网。