[发明专利]一种变形词证认系统及证认方法有效
| 申请号: | 201210537803.1 | 申请日: | 2012-12-12 | 
| 公开(公告)号: | CN103049434A | 公开(公告)日: | 2013-04-17 | 
| 发明(设计)人: | 张作职;宋传宝;王树强 | 申请(专利权)人: | 北京海量融通软件技术有限公司 | 
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 | 
| 代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;董烨飞 | 
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 变形 证认 系统 方法 | ||
1.一种变形词证认系统,其特征在于:
所述变形词证认系统包括原形词提供模块、变形词生成模块、变形词库、变形词检测模块、证认模块、概念库及变形词判别模块;其中,
所述原形词提供模块与所述变形词生成模块连接,所述变形词生成模块分别连接所述变形词库和所述变形词检测模块,所述证认模块分别与所述变形词检测模块、所述变形词判别模块和所述概念库进行连接;
所述原形词提供模块提供原形词,所述变形词生成模块在所述变形词库中查找所述原形词的变形词,将所述变形词提供给所述变形词检测模块,所述证认模块通过所述概念库的支持,检测待检测数据的语义背景与原形词概念集合的相似程度,所述变形词判别模块通过所述相似度值与预先设定的判别阈值比较,得出所检测的变形词是否为所述原形词的变形词的结论。
2.如权利要求1所述的变形词证认系统,其特征在于:
所述变形词证认系统中还包括数据提供模块,所述数据提供模块分别与所述变形词检测模块和所述证认模块进行连接。
3.如权利要求1所述的变形词证认系统,其特征在于:
所述变形词库中以原形词为主键,记录所述原形词的变形词;所述变形词包括但不限于汉语拼音、同音词、拼音首字母词、易混词、拆字变形词、英语同音词。
4.如权利要求1所述的变形词证认系统,其特征在于:
所述概念库是以原形词为节点的无向图,在节点之间以边相连,每条边表示两个节点的原形词属于相同的概念集合。
5.如权利要求4所述的变形词证认系统,其特征在于:
所述概念集合是与原形词节点相连的一级节点的集合。
6.一种变形词证认方法,基于权利要求1所述的变形词证认系统实现,其特征在于:
首先通过原形词,在变形词库查询其对应的变形词;
在得到原形词及变形词后,在待检测数据中做匹配运算,如果得到对应的变形词则继续,否则退出变形词证认;
如果待检测数据中存在变形词,将变形词前后一定范围内的文本数据作为语义背景;
通过原形词在概念库中查找与所述原形词相关的概念集合,计算所述概念集合与所述语义背景间的相似性,利用相似性度量变形词是所述原形词的变形词的信度值;
通过预先设定的判别阈值与所述信度值进行比较,得出变形词是不是所述原形词的变形词的结论。
7.如权利要求6所述的变形词证认方法,其特征在于:
在查询变形词的过程中,通过指定变形词类别作为过滤条件,得到所述原形词的不同形式的变形词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海量融通软件技术有限公司,未经北京海量融通软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210537803.1/1.html,转载请声明来源钻瓜专利网。





