[发明专利]通过迭代处理的名称标准化在审
| 申请号: | 201811608674.4 | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN110020213A | 公开(公告)日: | 2019-07-16 |
| 发明(设计)人: | U·梅尔哈夫;D·沙查姆;钟培德 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达;王英 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 职位 标准化 规范化 同义词 分词 规范化规则 一致性类型 迭代处理 建立关联 名称选择 输入频谱 搜索结果 质量特征 搜索 分类 | ||
示例性方法和系统涉及确定与输入职位名称相对应的标准化职位名称。输入职位名称可以根据各种规范化规则来进行规范化以产生规范化输入职位名称。规范化输入职位名称随后可以被分词成一个或多个n元语法,并且可以从各个n元语法中标识同义词。随后使用规范化输入职位名称、经分词的n元语法、以及所标识的同义词来搜索名称分类,其中搜索结果对应于与各个输入频谱的标准化职位名称。随后可以使用一致性类型特征和信息质量特征来对每个候选职位名称打分。随后将打分最高的候选职位名称选择作为针对输入职位名称的标准化职位名称。随后在标准化职位名称与输入职位名称之间建立关联。
相关申请的交叉引用
本申请要求享有于2017年12月18日递交的、名称为“TITLE STANDARDIZATIONTHROUGH ITERATIVE PROCESSING”的美国专利申请No.62/611,063的优先权权益,该申请的公开内容在此以引用方式全部并入本文。
技术领域
本文所公开的主题内容涉及词语处理和字符串分词,并且更具体而言,涉及通过对输入的原始词语和/或短语进行迭代处理和解构,在给定如输入的原始词语和/或短语的情况下确定标准化的词语和/或短语。
背景技术
社交网络服务可以被视为用于连接虚拟空间中的人的平台。社交网络服务可以是基于web的平台(诸如举例而言,社交网络网站),并且可以由用户经由web浏览器或经由在移动电话、平板设备等等上提供的移动应用来访问。社交网络服务可以是被专门设计用于商务社区的专注于商务的社交网络,其中注册的成员建立并记录他们在职业上认识并信任的人的网络。
每个注册的成员可以由成员简档来表示。成员简档可以由一个或多个网页来表示,或者是以XML(可扩展标记语言)、JSON(JavaScript对象表示法)或类似格式的成员信息的结构化表示。社交网络网站的成员简档网页可以突出相关联成员的工作历史和教育。
社交网络服务可以允许其成员利用关于他或她的工作的信息来填充他或她的成员简档。这允许成员向其他成员通知关于他或她的经验和资质。在描述他或她的工作时,社交网络服务可以允许成员自由地提供或输入与他或她的工作相对应的职位名称。这允许成员向社交网络服务提供他或她认为是他或她的职位的职位名称。
然而,虽然自由地输入职位名称的能力在与社交网络服务进行交互时提升成员的体验,但这种自由会影响由社交网络服务提供的其它特征,例如搜索具有输入职位名称的成员。由于不同成员可能针对类似职位输入不同职位名称,因此标识具有给定职位名称的成员会越来越困难。这是因为自由输入的职位名称导致数据库分段(fragmentation),并且用于在由成员输入的职位名称之中搜索输入职位名称的时间随着每个所输入的职位名称而增加。
附图说明
一些实施例通过举例来说明并且不限于附图。
图1是根据一些示例性实施例示出了包括社交网络服务器的联网系统的框图。
图2根据示例性实施例示出了图1的社交网络服务器。
图3根据示例性实施例示出了用于确定针对输入职位名称的标准化职位名称的工作流程图。
图4A-图4C是根据示例性实施例示出了用于确定针对输入职位名称的标准化职位名称的方法的流程图。
图5是根据一些示例性实施例示出了能够从机器可读介质(例如,机器可读存储介质)读取指令并执行本文所讨论的方法中的任何一个或多个方法的机器的组件的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811608674.4/2.html,转载请声明来源钻瓜专利网。





