[发明专利]一种商户名称翻译的方法及设备在审
申请号: | 202110426399.X | 申请日: | 2021-04-20 |
公开(公告)号: | CN113128240A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 向桥梁 | 申请(专利权)人: | 连通(杭州)技术服务有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/289 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 商户 名称 翻译 方法 设备 | ||
1.一种商户名称翻译的方法,其中,所述方法包括:
将待翻译的商户名称按照字符级别以及单词级别进行清洗,得到清洗后的商户名称;
识别所述清洗后的商户名称中所包含的地址信息、组织形式信息以及店铺信息,得到第一识别的商户名称;
识别所述第一识别的商户名称中的行业信息以及企业字号信息,得到第二识别的商户名称;
对所述第二识别的商户名称进行翻译,得到翻译后的商户名称。
2.根据权利要求1所述的方法,其中,识别所述清洗后的商户名称中所包含的地址信息、组织形式信息以及店铺信息,包括:
采用地点词库和自定义规则识别所述清洗后的商户名称中所包含的地址信息,其中,所述地点词库包括省、市、县及区的层次关系;
识别所述清洗后的商户名称中所含有的组织形式信息,所述组织形式信息包括个体户形式和企业形式;
识别所述清洗后的商户名称中所包含的店铺信息,所述店铺信息包括中心、广场、商行及商店。
3.根据权利要求1或2所述的方法,其中,识别所述第一识别的商户名称中的行业信息以及企业字号信息,包括:
按照分词识别方式识别所述第一识别的商户名称中的行业信息;
根据识别出的行业信息确定企业字号信息。
4.根据权利要求3所述的方法,其中,所述分词识别方式包括:
将所述第一识别的商户名称中的地址信息、组织形式信息以及店铺信息进行删除,得到删除后的商户名称;
将所述删除后的商户名称进行句子分词,得到多个词组;
从左到右逐一遍历每一个词组,判断所遍历到的词组是否在预设的行业词典中,将在预设的行业词典中的词组作为行业词组;
根据所有的行业词组确定行业信息。
5.根据权利要求4所述的方法,其中,根据识别出的行业信息确定企业字号信息,包括:
若在识别出的行业信息中包含检测出的行业词组,则将检测到的第一个行业词组之前的句子作为企业字号信息;
若在识别出的行业信息中未包含检测出的行业词组,则将当前的词组所在的句子作为企业字号信息。
6.根据权利要求5所述的方法,其中,对所述第二识别的商户名称进行翻译之前,包括:
对所述第二识别的商户名称中的企业字号信息进行提取目标信息并删除非法字符,其中,所述目标信息包括中文、拼音以及字母。
7.根据权利要求2所述的方法,其中,对所述第二识别的商户名称进行翻译,包括:
将所述第二识别的商户名称按照所属的组织形式对应的翻译方式进行翻译。
8.根据权利要求7所述的方法,其中,将所述第二识别的商户名称按照所属的组织形式对应的翻译方式进行翻译,包括:
若所属的组织形式为个体户形式,则将所述第二识别的商户名称直接进行拼音翻译,若所述第二识别的商户名称对应的商户类别编码在自定义词库中,则在拼音翻译结果后面增加使用在自定义词库中所述商户类别对应的英文;
若所属的组织形式为其它形式,则判断所述第二识别的商户名称中是否包含行业信息,基于判断结果对所述第二识别的商户名称进行翻译。
9.根据权利要求8所述的方法,其中,基于判断结果对所述第二识别的商户名称进行翻译,包括:
若所述判断结果为含有行业信息,则翻译所述第二识别的商户名称的第一个行业词组对应的英文并对企业字号进行翻译成拼音;
若所述判断结果为未含有行业信息且商户类别编码在自定义词库中,则使用在自定义词库中所述商户类别对应的英文进行翻译并对企业字号进行翻译成拼音。
10.根据权利要求5所述的方法,其中,对所述第二识别的商户名称进行翻译,包括:
若所述第二识别的商户名称中未包含所述行业企业字号和行业信息时,则将所述第二识别的商户名称进行拼音翻译并截断成预设数量的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于连通(杭州)技术服务有限公司,未经连通(杭州)技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110426399.X/1.html,转载请声明来源钻瓜专利网。