[发明专利]一种译员分级索引的方法有效

专利信息
申请号: 201310749990.4 申请日: 2013-12-30
公开(公告)号: CN103699675B 公开(公告)日: 2017-07-04
发明(设计)人: 江潮;张芃 申请(专利权)人: 语联网(武汉)信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京康盛知识产权代理有限公司11331 代理人: 张良
地址: 430070 湖北省武汉市东湖开发区光谷软件*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 译员 分级 索引 方法
【权利要求书】:

1.一种译员分级索引的方法,其特征在于,包括:

确定归属同一用户ID的多篇译后文档;

确定每篇所述译后文档的语句参数和词汇参数,根据所述参数计算出相对应的归一系数;

根据所述归一系数在等级标识数据库中匹配相应的级别;

建立所述级别与所述用户ID的关联关系;

根据所述关联关系,以所述级别作为索引词建立所述用户ID的索引关系;

其中,所述语句参数为语句复杂度,所述词汇参数为词汇复杂度。

2.根据权利要求1所述的方法,其特征在于,在建立了所述级别与所述用户ID的关联关系后,还包括:

在一定的时间阀值范围内,重新确定所述用户ID的多篇译后文档;

重新建立所述级别与所述用户ID的关联关系,以用于实时更新所述用户ID的索引关系。

3.根据权利要求1所述的方法,其特征在于,确定的所述多篇译后文档为所述用户ID对应的译员在一定的时间范围内通过审校后的稿件。

4.根据权利要求1所述的方法,其特征在于,

计算所述语句复杂度的过程包括:

分析出所述译后文档的整句的平均长度、所述整句中的第一类子句的平均长度、长句的平均长度和所述长句中的第二类子句的平均长度;

按照语句复杂度计算公式计算,得到所述译后文档的所述语句复杂度;所述语句复杂度计算公式如下:

diff_sentence=K21·MLS+K22·MLC+K23·MLL+K24·MLCL;

其中,diff_sentence为语句复杂度,MLS为所述整句的平均长度,MLC为所述第一类子句的平均长度,MLL为所述长句的平均长度,MLCL为所述第二类子句的平均长度,K21、K22、K23和K24为通过样本计算得到语句复杂度调节系数。

5.根据权利要求4所述的方法,其特征在于,

计算所述词汇复杂度的过程包括:

分析出所述译后文档中的词汇等级、类符形符比和实义词词义密度;

按照词汇复杂度计算公式计算,得到所述译后文档的词汇复杂度;所述词汇复杂度计算公式如下:

diff_word=K11·grade_word+K12·STTR+K13·density_notional

其中,diff_word为所述文档词汇复杂度,grade_word为所述文档的词汇等级,STTR为所述文档的类符形符比,density_notional为所述文档的实义词词义密度,K11、K12和K13为通过样本计算得到词汇复杂度调节系数;

其中,分析所述译后文档的实义词词义密度的过程包括:

确定所述译后文档中的所有词汇,对每个词汇进行词性标注,得到其中的实义词;

将得到的所有所述实义词按照一定顺序进行排列;

根据同义词本体工具得到每个所述实义词的义项数meaningsi,其中i为所述实义词的序号;并统计所述实义词的义项总数;

按照实义词词义密度计算公式计算,得到所述文档的实义词词义密度;所述实义词词义密度计算公式如下:

<mrow><mi>d</mi><mi>e</mi><mi>n</mi><mi>s</mi><mi>i</mi><mi>t</mi><mi>y</mi><mo>_</mo><mi>n</mi><mi>o</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi><mi>a</mi><mi>l</mi><mo>=</mo><mfrac><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mo>_</mo><mi>n</mi><mi>o</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi><mi>a</mi><mi>l</mi></mrow></msubsup><msub><mi>meanings</mi><mi>i</mi></msub></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mo>_</mo><mi>n</mi><mi>o</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi><mi>a</mi><mi>l</mi></mrow></msubsup><msub><mi>meanings</mi><mi>i</mi></msub><mo>+</mo><mrow><mo>(</mo><mi>w</mi><mi>o</mi><mi>r</mi><mi>d</mi><mo>-</mo><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mo>_</mo><mi>n</mi><mi>o</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi><mi>a</mi><mi>l</mi><mo>)</mo></mrow></mrow></mfrac><mo>;</mo></mrow>

其中,meaningsi为第i个实义词的义项数,count_notional为所述实义词的数量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310749990.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top