[发明专利]一种译员分级索引的方法有效
申请号: | 201310749990.4 | 申请日: | 2013-12-30 |
公开(公告)号: | CN103699675B | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 江潮;张芃 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 张良 |
地址: | 430070 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 译员 分级 索引 方法 | ||
1.一种译员分级索引的方法,其特征在于,包括:
确定归属同一用户ID的多篇译后文档;
确定每篇所述译后文档的语句参数和词汇参数,根据所述参数计算出相对应的归一系数;
根据所述归一系数在等级标识数据库中匹配相应的级别;
建立所述级别与所述用户ID的关联关系;
根据所述关联关系,以所述级别作为索引词建立所述用户ID的索引关系;
其中,所述语句参数为语句复杂度,所述词汇参数为词汇复杂度。
2.根据权利要求1所述的方法,其特征在于,在建立了所述级别与所述用户ID的关联关系后,还包括:
在一定的时间阀值范围内,重新确定所述用户ID的多篇译后文档;
重新建立所述级别与所述用户ID的关联关系,以用于实时更新所述用户ID的索引关系。
3.根据权利要求1所述的方法,其特征在于,确定的所述多篇译后文档为所述用户ID对应的译员在一定的时间范围内通过审校后的稿件。
4.根据权利要求1所述的方法,其特征在于,
计算所述语句复杂度的过程包括:
分析出所述译后文档的整句的平均长度、所述整句中的第一类子句的平均长度、长句的平均长度和所述长句中的第二类子句的平均长度;
按照语句复杂度计算公式计算,得到所述译后文档的所述语句复杂度;所述语句复杂度计算公式如下:
diff_sentence=K21·MLS+K22·MLC+K23·MLL+K24·MLCL;
其中,diff_sentence为语句复杂度,MLS为所述整句的平均长度,MLC为所述第一类子句的平均长度,MLL为所述长句的平均长度,MLCL为所述第二类子句的平均长度,K21、K22、K23和K24为通过样本计算得到语句复杂度调节系数。
5.根据权利要求4所述的方法,其特征在于,
计算所述词汇复杂度的过程包括:
分析出所述译后文档中的词汇等级、类符形符比和实义词词义密度;
按照词汇复杂度计算公式计算,得到所述译后文档的词汇复杂度;所述词汇复杂度计算公式如下:
diff_word=K11·grade_word+K12·STTR+K13·density_notional
其中,diff_word为所述文档词汇复杂度,grade_word为所述文档的词汇等级,STTR为所述文档的类符形符比,density_notional为所述文档的实义词词义密度,K11、K12和K13为通过样本计算得到词汇复杂度调节系数;
其中,分析所述译后文档的实义词词义密度的过程包括:
确定所述译后文档中的所有词汇,对每个词汇进行词性标注,得到其中的实义词;
将得到的所有所述实义词按照一定顺序进行排列;
根据同义词本体工具得到每个所述实义词的义项数meaningsi,其中i为所述实义词的序号;并统计所述实义词的义项总数;
按照实义词词义密度计算公式计算,得到所述文档的实义词词义密度;所述实义词词义密度计算公式如下:
其中,meaningsi为第i个实义词的义项数,count_notional为所述实义词的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310749990.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种游梁抽油机毛辫子的长度调节装置
- 下一篇:内置螺旋槽导热热管