[发明专利]一种行业应用软件词根表的构建方法有效
申请号: | 201310077331.0 | 申请日: | 2013-03-12 |
公开(公告)号: | CN103150376A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 左春;庞朴;张正;魏萍 | 申请(专利权)人: | 中科软科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行业 应用软件 词根 构建 方法 | ||
技术领域
本发明涉及行业应用软件建设领域,具体地说,就是建设一个支撑行业应用软件开发的语义字典表(词根表),从而规范程序中数据结构命名、功能和程序命名、需求规格说明书中主要术语命名。本发明不仅能应用于保险领域,对其他领域的行业应用也有指导意义。
背景技术
词根是最基础的词及其缩写符号,也包括某些词根组成的新词,由中英文为基础,另加多种语言的词根集合组成词根表。(参考行业应用软件中的词根表和库结构,左春,2009.)
行业应用软件中的词根表是由表述领域内容的术语组成的词码表。统一词根表是标准化的语义定义,便于更大范围的交流和共享。
行业应用软件开发过程中的词根是领域概念在软件实现过程中的缩写与约定,是软件设计和实现中各种概念元素命名构造的基本单位。词根的整理旨在统一领域语义,对行业应用软件开发形成一套规范和标准,实现软件开发过程“成果物”的一致性,供开发人员参考遵循,避免不必要的重复工作和资源浪费,提高工作效率和质量。
虽然词根表是行业应用软件开发的基础性文件,但真正比较成熟的词根表构建方法并不多,构建方法效率低,而且所构建词根表中的词根语义不统一,给后续的应用软件开发和开发文件的可读性带来严重问题。
发明内容
本发明解决的技术问题:提升词根命名的一致性,构建一个开放、稳定的词根表系统。
本发明的目的是提供一种行业应用软件词根表的构建方法。基于此生成的词根表是行业应用软件构建和实施的基础,是开发过程一系列成果物的重要支撑。完善、规范的词根表,有助于提高开发效率,提升软件品质。
行业应用软件针对有特定含义的领域对象,且需要实现程序对象和领域对象间有效的映射。为解决行业应用软件用词的随意性,提升映射效率,特将领域术语中稳定的部分做成词根表,以便在行业应用软件中有效的使用。事实上,特定领域内的语义字典表积累具有重要意义。我们凭借在行业应用领域的多年经验和领域知识积累,实现了词根表在保险领域内的良好实践。IDC“中国保险解决方案2009-2013市场预测与分析”指出,中科软在保险行业IT解决方案(包括财产险核心业务系统、寿险核心业务系统、ERM、多渠道客户服务、网上保险系统、再保险业务处理系统等)提供商的收入及市场份额连续五年均排名第一。
为实现上述目的,本发明的解决方案是:
●提出词根表的定义和组成
词根表是行业应用软件中用以表述领域术语的词码表,也称语义字典表。词根是最基础的词及其缩写符号的集合,由于“程序块”的独立发展及业务的不断创新,还将不断产生新的词根,词根还可组成新词。
词根表的主要组成部分如图1所示。
基础的词根表由中英文词根构成双语词根表,可根据实际业务需求增加新的语种。
●给出词根表的构建方法
该方法的主要思想是:基于词根表初始库,当有新的“个体”(每一条词根称为一个“个体”)加入时,对初始库按照中英文名称进行检索,已存在的“个体”按照构成补充其他属性(如果有),不存在的“个体”按照“适合”系数算法的规则检索规范文件,计算综合评价“适合”系数(fitness)大小,选择优化的(“适合”系数较大的)“个体”加入词根表,并依据词根表已确定的“适合”条件进行尾部淘汰,形成开放、稳定的词根表。其中“开放的”表示“个体”是不断加入和尾部淘汰的,“容错的”表示“个体”有一部分是“试探性的”,不太肯定的。
词根表的构建步骤如下:
(1)形成初始库,区分当前库和历史库,按照中英文名称对初始库进行唯一性检查;
(2)当有新“个体”需要加入时,按照中英文名称匹配检索已有词根表(当前库);
(3)在库中检索到该“个体”时(比如有匹配中文名称和英文名称的个体),按照规则补充其他属性,循环至(5);
(4)对未检索到的“个体”(即与已有词根表不匹配),检索规范文件(主要是指《ACORD》、《保险术语表》等文件),生成“适合”系数,多个选择中选“适合”系数较高的“个体”进入词根表(即要进入词根表的多个个体具有相同的中文名称或英文名称);
(5)对新进入“个体”添加其他属性,如果“个体”数大于n(设n=5000),则在“当前库”中选择“适合”系数最低者进入“历史库”;检索存在的个体在补充属性时就有了适合系数;
(6)循环至(2)。
与现有技术相比,本发明的积极效果为:
将原本封闭的词根表积累过程变为开放式的,容错的,渐进替代的过程,从而提升了词根表构建的稳定性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科软科技股份有限公司,未经中科软科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310077331.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:城市公交信号智能导引系统
- 下一篇:单边同步器