[发明专利]针对头衔标准化的与语言无关的机器学习模型在审
申请号: | 201910909805.0 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110956253A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | S·A·乔尔;U·默哈夫;D·沙查姆 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/9532 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 头衔 标准化 语言 无关 机器 学习 模型 | ||
1.一种系统,包括:
具有存储在其上的指令的计算机可读介质,其中,所述指令当由处理器执行时,使得所述系统执行包括以下项的操作:
获得第一组训练数据,所述第一组训练数据包括职位头衔与标准化的职位头衔标识的对;
获得第二组训练数据,所述第二组训练数据包括职位头衔与技能的对;
将所述第一组训练数据馈送到深度卷积神经网络(DCNN)中,所述DCNN被设计为训练预测模型以输出预测分数,所述预测分数指示输入候选职位头衔与输入职位头衔标识相匹配的可能性;
将所述第二组训练数据馈送到所述DCNN中,以便再次训练所述预测模型;
将第一候选职位头衔和多个候选职位头衔标识馈送到所述预测模型中,以产生针对所述第一候选职位头衔与候选职位头衔标识的每个配对的预测分数;以及
保存所述第一候选职位头衔与来自所述多个候选职位头衔标识中具有最高预测分数的候选职位头衔标识之间的映射。
2.根据权利要求1所述的系统,其中,所述将所述第一组训练数据馈送到所述DCNN中包括:
将所述第一组训练数据传递至所述DCNN的卷积层,所述卷积层包括具有动态可调节的权重的一个或多个过滤器,所述一个或多个过滤器被配置为过滤所述第一组训练数据以产生针对所述第一组训练数据的每个片段的输出容量,所述输出容量针对所述一个或多个过滤器中的每个过滤器包括不同的特征映射;
将来自所述卷积层的输出容量传递通过非线性层,所述非线性层对来自所述卷积层的输出容量应用非线性函数;
将来自所述非线性层的输出容量传递通过池化层,所述池化层降低来自所述非线性层的输出容量的维度;
将来自所述池化层的输出容量传递通过分类层,所述分类层包括专用卷积层,所述专用卷积层具有过滤器,所述过滤器被设计为基于来自所述池化层的输出容量来输出针对所述第一组训练数据的每个片段的预测分数;
将所述第一组训练数据传递通过损失层,所述损失层对所述第一组训练数据应用损失函数,以得出对误差水平的指示,所述误差水平是来自所述分类层的、针对所述第一组训练数据的每个片段的所述预测分数与来自所述第一组训练数据的每个片段的标签的预测分数的比较;
确定针对所述第一组训练数据的所述误差水平的组合是否超过预设阈值;以及
响应于确定所述误差水平的所述组合超过所述预设阈值,更新所述DCNN的所述卷积层中的所述一个或多个过滤器的所述权重,以降低所述误差水平的所述组合并且使用不同的一组训练数据来重复对所述DCNN的所述训练。
3.根据权利要求1所述的系统,其中,所述第一组训练数据是从头衔标识的分类法获得的,所述分类法具有所述头衔标识与头衔之间的存储的映射。
4.根据权利要求1所述的系统,其中,所述第一组训练数据是从在线服务的成员的成员简档获得的,所述成员简档中的每个成员简档是以至少两种语言书写的。
5.根据权利要求1所述的系统,其中,所述第一组训练数据是从机器翻译的头衔获得的。
6.根据权利要求1所述的系统,其中,所述第一组训练数据是从头衔的群组获得的,所述头衔的群组与其他头衔在字符方面是类似的。
7.根据权利要求1所述的系统,其中,所述第二组训练数据是从在线服务的成员的成员简档获得的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910909805.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车身前部结构
- 下一篇:用于半自主车辆的操控信号的确定