[发明专利]一种汉字字义、字音、字形的相似度比对系统及方法在审
申请号: | 201910098963.2 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109840326A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 宋晗;王博;张鑫慧;蒋宽;兰恭伟 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似度比对 汉字 字义 字音 内存计算 服务层 数据层 管控 工作效率 名称比对 大数据 相似度 存储 审核 | ||
本发明公开了一种汉字字义、字音、字形的相似度比对系统及方法,属于大数据技术领域。本发明的汉字字义、字音、字形的相似度比对系统包括服务层、数据层和管控层,所述管控层设置有汉字相似度库、汉字相似度比对规则和分布式内存计算,服务层中运行汉字相似度比对和分布式内存计算,数据层用于存储名称比对过程的数据。该发明的汉字字义、字音、字形的相似度比对系统能够更加科学准确的进行名称相似度比对,提高了名称相似度比对的准确性,大大提高名称审核的工作效率,具有很好的推广应用价值。
技术领域
本发明涉及大数据技术领域,具体提供一种汉字字义、字音、字形的相似 度比对系统及方法。
背景技术
随着社会的不断进步,社会经济飞速发展,同时也带动各项科学技术的不 断进步。计算机具有存储信息量大,使用者获取信息方便快捷等优点,受到广 泛的应用。特别是近年来,随着社会及经济的进一步发展,计算机的应用领域 逐步扩展,计算机在各个领域都得到广泛的应用。其中,计算机在企业/个体名 称申报过程中的应用也越来越广泛。
但是,现有技术中,企业/个体名称申报过程中,需要审核人员根据名称中 包含的汉字的字义、字音和字形在海量已申请名称中进行相似度比对,传统方 式下,审核人员需要人工进行分词多次模糊查询才能判定名称是否允许使用, 降低了工作效率,有待进一步改进。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种能够更加科学准确的 进行名称相似度比对,提高了名称相似度比对的准确性,大大提高名称审核的 工作效率的汉字字义、字音、字形的相似度比对系统。
本发明进一步的技术任务是提供一种汉字字义、字音、字形的相似度比对 方法。
为实现上述目的,本发明提供了如下技术方案:
一种汉字字义、字音、字形的相似度比对系统,包括服务层、数据层和管 控层,所述管控层设置有汉字相似度库、汉字相似度比对规则和分布式内存计 算,服务层中运行汉字相似度比对和分布式内存计算,数据层用于存储名称比 对过程的数据。
该汉字字义、字音、字形的相似度比对系统,基于汉字管控层的汉字相似 度库,对汉字字义、字音、字形进行分析比较,采用分布式内存计算思想,在 海量已存数据中进行比对运算并计算相似度评分,根据相似度评分自动对申请 人申报的企业/个体名称进行审核。
该系统的工作过程为,系统启动后将已经申报成功的企业/个体名称数据加 载到内存中供名称申报相似度比对使用。企业/个体名称申请人从互联网进行名 称申请填报。填报完成后点击“提交”,后台对申报的名称进行字义、字音、字 形相似度比对,将比对结果直接展示给名称申请人,对于符合企业/个体名称管 理规定的名称给予审核通过提示,对于相似度较高的企业/个体名称会将相似度 列表进行展示,告知申请人审核不通过的原因。对于新申报成功的企业/个体名 称会自动加载到内存中继续参加相似度比对。
通过该汉字字义、字音、字形的相似度比对系改变传统的企业/个体名称审 核人工审核方式,由机器按照字义、字音、字形相似度比对进行自动判定,将 原人工审核7至15天审核周期降低为秒级别自动审核,提高了企业/个体名称 的审核效率和准确性,使工商顶级审批业务迈入自动化审批时代。
作为优选,该汉字字义、字音、字形的相似度比对系统还包括表现层,所 述表现层用于申请人进行申请名称的输入并显示名称比对结果。
作为优选,所述服务层中运行的分布式内存计算过程包括数据分片、多节 点、并行计算和运算结果合并。
作为优选,所述表现层采用个人电脑PC。
作为优选,所述数据层采用Oracle数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910098963.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于点互信息的文本语义相似性度量方法
- 下一篇:一种词汇识别方法及装置