[发明专利]一种词根表的相似词处理方法无效
申请号: | 201310077532.0 | 申请日: | 2013-03-12 |
公开(公告)号: | CN103116659A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 左春;庞朴;张正;魏萍 | 申请(专利权)人: | 中科软科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 词根 相似 处理 方法 | ||
技术领域
本发明属于行业应用软件建设领域,具体涉及一种词根表的相似词处理方法,主要是对支撑行业应用软件数据字段命名的语义字典表进行相似词的处理。
背景技术
词根表是行业应用软件中用以表述领域内容的术语组成的词码表。词根包括最基础的词及其缩写符号,也可以是某些词根组成的新词。词根是领域概念在软件实现过程中的缩写与约定,是软件设计和实现中各种概念元素命名构造的基本单位。词根的分类进退设计旨在适应行业软件开发规范和标准的发展,统一领域语义,实现软件开发过程成果物的一致性,供开发人员参考遵循,避免不必要的重复工作和资源浪费,提高工作效率和质量。
在词根表的层面进行相似词的处理和积累,有利于为软件开发人员设计数据结构、撰写需求规格说明书提供更多的选择性;为建议书系统等行业应用提供可用素材,同时有利于构建一个开放、丰富的词根表体系。
发明内容
本发明解决的技术问题:本发明提出了一种行业应用软件词根表中相似词的处理方法。
本发明的目的是提供一种行业应用软件词根表中相似词的处理方法。基于此处理方法生成的词根表相似库反映了行业业务的实际发展需求。词根表是行业应用软件构建和实施的基础,是开发过程一系列成果物的重要支撑。丰富、多样的词根表体系,有助于提高开发效率,提升软件品质。
IDC“中国保险解决方案2009-2013市场预测与分析”指出,中科软在保险行业IT解决方案(包括财产险核心业务系统、寿险核心业务系统、ERM、多渠道客户服务、网上保险系统、再保险业务处理系统等)提供商的收入及市场份额连续五年均排名第一。
该方法的主要思想是:当新个体加入词根表时,计算相似“个体”的相似系数和“适合”系数,适合系数最大者进入词根表当前库,其他个体则加入相似库,并补充相似库和属性。词根表相似词的处理步骤如下:
(1)新“个体”加入词根表时,计算与已有词根表及相似库“个体”的相似系数;
(2)相似系数大于k(如0.9)的所有个体中,“适合”系数最大者保留在词根表中,其余个体进入相似库;
(3)补充“个体”在相似库中其余属性。
其中,据规范文件ACORD文件、金融术语文件、《精编英汉保险词典》、保险术语表和保险术语文件计算适合系数。
与现有技术相比,本发明的积极效果为:
本发明在词根表这一指导行业软件开发的标准制定过程中,增加了相似词的处理,提升了词根表对领域业务反映的广泛性。中科软凭借在行业应用领域的经验和领域知识积累,实现了词根表相似词处理在保险领域内的良好实践。
随着大数据的广泛应用,以建议书系统等为代表的行业应用不断发展,在这种情况下,从词根表的层面进行相似词的处理和积累,可方便进行更多的行业应用。本发明不仅能应用于保险领域,对其他领域的行业应用也有指导意义。
附图说明
附图为本发明的方法流程图。
具体实现方式
下面结合附图对本发明进行详细描述。本发明的处理方法流程如图所示。
1)有新“个体”加入时,计算与已有词根表及相似库“个体”的相似系数;
2)相似系数大于k(如0.9)的所有个体中,“适合”系数最大者保留在词根表中,其余个体进入相似库;
3)补充“个体”在相似库中其余属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科软科技股份有限公司,未经中科软科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310077532.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种一次性弹跳下水器提笼
- 下一篇:一种改进型的黑板