[发明专利]一种中文商标相似度计算方法在审
申请号: | 202110790797.X | 申请日: | 2021-07-13 |
公开(公告)号: | CN113468885A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 李学俊;高仕锦;廖伟伟 | 申请(专利权)人: | 安徽大学绿色产业创新研究院 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 闫客 |
地址: | 230088 安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 商标 相似 计算方法 | ||
1.一种中文商标相似度计算方法,其特征在于,包括:
获取待比较的第一商标和第二商标的名称,并对第一商标名称和第二商标名称进行分词处理,分别得到第一分词列表和第二分词列表;
对两个分词列表中的词语两两组合计算词林词语相似度、知网词语相似度以及Word2Vec词语相似度;
采用动态加权策略分别计算第一分词列表中的各个词语与第二分词列表中的每个词语的词林词语相似度、知网词语相似度及Word2Vec词语相似度的综合相似度作为第一分词列表中各个词语对应的词语相似度组,取各个词语对应的词语相似度组中的最大值作为当前词语的局部相似度,将第一分词列表中的所有词语的局部相似度组成第一局部相似度列表;
采用动态加权策略分别计算第二分词列表中的各个词语与第一分词列表中的每个词语的词林词语相似度、知网词语相似度及Word2Vec词语相似度的综合相似度作为第二分词列表中各个词语对应的词语相似度组,取各个词语对应的词语相似度组中的最大值作为当前词语的局部相似度,将第二分词列表中的所有词语的局部相似度组成第二局部相似度列表;
根据第一局部相似度列表和第二局部相似度列表,计算第一商标的名称和第二商标的名称的含义相似度。
2.如权利要求1所述的中文商标相似度计算方法,其特征在于,所述第一分词列表中的第r个词语War与所述第二分词列表中的第m个词语Wbm之间的词林词语相似度SimCilin(War,Wbm)的计算步骤包括:
利用《同义词林扩展版》词典文件cilinFile构建商标词林同义词库traCilinFile;
根据商标词林同义词库traCilinFile将词语War与词语Wbm转为词林编码,并获取词语War与词语Wbm对应的所有词林编码的组合;
基于所有词林编码的组合,判断组合中是否存在词林编码相等的情况;
若存在,则读取当前编码所在行的词群,并判断词语War与词语Wbm是否构成相似,若不近似,则记SimCilin(War,Wbm)=0,若近似,则记SimCilin(War,Wbm)=1;
若不存在,采用基于信息内容的词林相似度计算方法计算所有词林编码组合的相似度,取最大值作为SimCilin(War,Wbm)。
3.如权利要求2所述的中文商标相似度计算方法,其特征在于,所述利用《同义词林扩展版》词典文件cilinFile构建商标词林同义词库traCilinFile,包括:
将所述《同义词林扩展版》词典文件cilinFile中词林编码相同的同一行的词语互不相似的标记为数字0;
将所述《同义词林扩展版》词典文件cilinFile中词林编码相同的同一行的词语互为相似的标记为同一种非0数字,构建得到所述商标词林同义词库traCilinFile。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学绿色产业创新研究院,未经安徽大学绿色产业创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110790797.X/1.html,转载请声明来源钻瓜专利网。