[发明专利]主动实体解析模型推荐系统在审
申请号: | 202110294500.0 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113886558A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | M.陶;V.庞贾比;D.赫尔曼 | 申请(专利权)人: | SAP欧洲公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/387;G06F16/338;G06F16/35;G06F16/9537;G06F40/205;G06F40/295;G06Q30/06 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主动 实体 解析 模型 推荐 系统 | ||
1.一种计算机实施的方法,包括:
在计算系统接收新数据记录的请求数据字段;
由所述计算系统访问包括多个代表性数据记录的主数据,每个代表性数据记录代表相似数据记录的集群,并且每个相似数据记录具有置信得分,所述置信得分指示所述相似数据记录对应于所述集群的置信度;
使用机器学习模型将所述新数据记录与所述多个代表性数据记录中的每个代表性数据记录进行比较,以针对每个代表性数据记录生成距离得分,所述距离得分与所述新数据记录和每个代表性数据记录之间的距离相对应;
选择具有在距离阈值内的生成的距离得分的代表性数据记录集合;
分析与所述代表性数据记录集合中的每个代表性数据记录相对应的相似数据记录的集群,以针对所述新数据记录的请求数据字段生成候选值;
使用所述候选值所对应的代表性数据记录的距离得分和所述候选值所对应的相似数据记录的置信得分,来为所述候选值中的每一个生成候选得分;以及
基于所述候选值的候选得分,针对所述请求数据字段提供推荐。
2.根据权利要求1所述的计算机实施的方法,其中,所述请求数据字段是供应商名称或目录。
3.根据权利要求1所述的计算机实施的方法,其中,通过执行操作生成所述主数据,所述操作包括:
访问包括多个数据记录的数据源;
将所述数据记录分组到包括相似数据记录的集群中;
生成代表性数据记录以代表相似数据记录的每个集群;
针对每个相似数据记录生成置信得分,所述置信得分指示所述相似数据记录对应于所述集群的置信度;以及
将包括多个代表性数据记录的主数据存储在一个或多个数据存储中。
4.根据权利要求1所述的计算机实施的方法,其中,所述距离阈值是指定值,并且基于所述代表性数据记录集合中的每个代表性记录具有大于所述距离阈值的指定值的距离得分,来选择所述代表性数据记录集合。
5.根据权利要求1所述的计算机实施的方法,其中,使用所述候选值所对应的代表性数据记录的距离得分和所述候选值所对应的相似数据记录的置信得分,来为所述候选值中的每一个生成所述候选得分,包括:
对于每个相似数据记录,将所述距离得分乘以所述置信得分以生成乘积值;
对于每个候选值,组合包括所述候选值的每个相似数据记录的乘积值以生成组合乘积值;
确定每个候选值出现于其中的相似数据记录的数目的计数;以及
基于所述组合乘积值和所述候选值的计数,为所述候选值中的每一个生成所述候选得分。
6.根据权利要求1所述的计算机实施的方法,还包括:
基于所述候选得分对所述候选值进行排序;以及
其中,基于所述排序的候选值,提供针对所述请求数据字段的推荐。
7.根据权利要求6所述的计算机实施的方法,其中,基于所述候选得分对所述候选值进行排序包括:首先基于候选得分,其次基于指示所述候选值出现于其中的集群的数目的集群计数,并且第三基于指示所述候选值出现于其中的相似记录的数目的记录计数对所述候选值进行排序。
8.根据权利要求1所述的计算机实施的方法,其中,基于所述候选值的候选得分,提供针对所述请求数据字段的推荐包括:提供具有最高候选得分的候选值作为针对所述请求数据字段的推荐。
9.根据权利要求7所述的计算机实施的方法,其中,基于所述排序的候选值,提供针对所述请求数据字段的推荐包括:基于待提供的推荐的预定数目,提供具有最高候选得分的候选值的子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110294500.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于基板的线路量测系统
- 下一篇:块茎类蔬菜加工装置