[发明专利]商标词语与通用词语的区分方法、装置、设备及存储介质有效
申请号: | 202110084176.X | 申请日: | 2021-01-21 |
公开(公告)号: | CN112883150B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 侯丽;张其乐 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/117;G06F40/211;G06F40/30;G06F18/214 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;罗志强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商标 词语 通用 区分 方法 装置 设备 存储 介质 | ||
本发明提供了一种商标词语与通用词语的区分方法、装置、设备及存储介质,其中,方法包括:通过商标词语库找出第一文本中的待区分词语,获取其表示商标的商标词语,并根据该商标词语获取相似的商标词语,由于商标词语的替换,会使得原本表示通用词语的待区分词语所在目标句子的通顺度降低,由此可以区分出商标词语和通用词语,另外,也无需复杂的语义分析,只需要将待区分词语进行替换,再检测目标句子的通顺度即可,节约了研发成本。
技术领域
本发明涉及数据处理领域,特别涉及一种商标词语与通用词语的区分方法、装置、设备及存储介质。
背景技术
许多公司采用了一些通用词语作为公司的商标词语,为了对文本中表示商标词语的词语进行标注,需要对文本中的待区分词语进行识别,以判断其是否为商标词语。目前,文本的识别方法有很多,但一般都是通过语义识别进行区分,但是语义识别的流程比较复杂,而且误差比较大,无法正确的区分出商标词语与通用词语。
发明内容
本发明的主要目的为提供一种商标词语与通用词语的区分方法、装置、设备及存储介质,旨在解决语义识别的流程比较复杂,而且误差比较大,无法正确的区分出商标词语与通用词语的问题。
本发明提供了一种商标词语与通用词语的区分方法,包括:
根据商标词语库识别第一文本中的待区分词语;
将所述待区分词语以商标词语的身份输入至预设对应表中,得到所述商标词语对应的公司经营范围标签;其中所述预设对应表中预存有所述商标词语与公司经营范围标签的对应关系;
在所述预设对应表中获取同样具有所述公司经营范围标签的相似商标词语;
将所述相似商标词语替换所述第一文本中的待区分词语,得到第二文本;
检测所述第二文本中含有所述相似商标词语的目标句子的通顺度;
将通顺度大于预设通顺度的所述相似商标词语所对应的待区分词语认定为商标词语。
进一步地,所述检测所述第二文本中含有所述相似商标词语的目标句子的通顺度的步骤,包括:
将所述目标句子中的所述相似商标词语进行标记;
通过句子通顺度识别模型识别标记后的所述目标句子;其中,句子通顺度识别模型基于若干包含有所述商标词语库中的词语的通顺句子训练而成;
基于所述句子通顺识别模型对每个所述目标句子的识别结果,得到各目标句子的所述通顺度。
进一步地,所述通过句子通顺度识别模型识别标记后的所述目标句子的步骤,包括:
检测所述目标句子中所述相似商标词语相邻的前一个词语,以及相邻的后一个词语;
根据所述句子通顺度识别模型中的匹配概率计算公式,计算所述相似商标词语与所述前一个词语的第一匹配概率,以及与所述后一个词语的第二匹配概率;
计算所述第一匹配概率和所述第二匹配概率的乘积值,以得到所述目标句子的识别结果。
进一步地,所述获取所述待区分词语以表示商标词语的商标词语,基于所述公司经营范围标签获取同类公司的相似商标词语的步骤,包括:
解析所述公司经营范围标签得到对应的公司;
获取所述公司的业务类别;
根据所述业务类别获取同类别的公司经营范围标签;
根据所述同类别的公司经营范围标签获取对应的商标词语作为所述相似商标词语。
进一步地,所述根据商标词语库识别第一文本中的待区分词语的步骤之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110084176.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型汽车零件固定夹具
- 下一篇:自组装模块化机器人单元对接系统及对接方法