[发明专利]一种自然语言句子的语义角色标注方法无效
| 申请号: | 200810243605.8 | 申请日: | 2008-12-10 |
| 公开(公告)号: | CN101446942A | 公开(公告)日: | 2009-06-03 |
| 发明(设计)人: | 王红玲;朱巧明;钱培德;孔芳;李培峰;周国栋;钱龙华 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 苏州创元专利商标事务所有限公司 | 代理人: | 陶海锋 |
| 地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自然语言 句子 语义 角色 标注 方法 | ||
1.一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注,包括如下步骤:
(1)生成语义角色标注模型:
生成训练文件:从标注语料库中,根据下表中的特征抽取特征,生成所需的训练文件;
模型生成:利用训练文件对最大熵分类器模型进行训练,得到语义角色标注模型文件;
(2)生成联合学习模型:
提取训练语料:从树库中,提取出句法分析训练语料,句法分析的训练事件中包含语义特征;
生成训练文件:在句法分析模型常用特征基础上,添加语义特征,生成训练文件;
所述句法分析模型常用特征由下表表示:
所述语义特征由下表表示:
语义特征的获取采用步骤(1)的语义角色标注模型实现;
模型生成:利用训练文件对最大熵分类器模型进行训练,得到联合学习模型文件;
(3)词性标记:调用词性标记模块,对给定句子进行词性标注,保留前N种最优的词性标记系列结果;
(4)基本短语识别:调用基本短语识别模块,分别对步骤(3)输出的N种词性标记结果,进行基本短语识别,最后保留前N种最优的基本短语识别结果;
(5)句法分析:调用联合学习模型,以步骤(4)输出的N种基本短语识别结果作为输入,输出最优的句法分析结果和语义角色标注结果;
其中,N为10~20的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810243605.8/1.html,转载请声明来源钻瓜专利网。





