[发明专利]利用索引串匹配的上下文盲数据转换有效
| 申请号: | 201380053552.2 | 申请日: | 2013-06-25 |
| 公开(公告)号: | CN104718542B | 公开(公告)日: | 2018-09-07 |
| 发明(设计)人: | P·戈伦;L·里瓦斯;E·A·格林 | 申请(专利权)人: | 甲骨文国际公司 |
| 主分类号: | G06F17/22 | 分类号: | G06F17/22 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 边海梅 |
| 地址: | 美国加*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 索引 匹配 上下 文盲 数据 转换 | ||
1.一种用于将数据从第一形式转换到第二形式的方法,包括:
利用基于计算机的工具,识别要从第一形式转换到第二形式的数据集合,其中所述数据集合是上下文不确定的,使得第一形式的数据的上下文不是可辨别的;
利用基于计算机的工具,访问多个模式,每个模式包括用于在数据的特定上下文中转换数据的一个或多个转换规则,其中用于每个相应模式的所述一个或多个转换规则至少部分地基于该相应模式的所述特定上下文;
将所述数据集合和所述多个模式的每一个表示为一个或多个特征,其中所述数据集合表示为源特征,并且所述多个模式表示为目标特征;
编译对应于所述目标特征的索引,其中所述索引包括用于每个目标特征到包含所述目标特征的多个模式中的每个模式的映射;
确定所述多个模式的子集,其中将要相对于所述多个模式的子集为所述数据集合计算相似性度量,其中所述多个模式的子集包括少于所述多个模式的整体;
利用基于计算机的工具,利用独立于所述数据集合和所述多个模式的上下文执行的索引串匹配,将所述数据集合与所述多个模式的至少一部分进行比较,其中执行所述索引串匹配包括相对于所述多个模式的子集为所述数据集合计算相似性度量,其中所述相似性度量至少部分地基于所述目标特征和源特征之间的共性;
利用基于计算机的工具,至少部分地基于所述比较,从所述多个模式中选择选定的模式;及
将所述选定的模式的一个或多个转换规则应用到所述数据集合,以将所述数据集合从所述第一形式转换到所述第二形式。
2.如权利要求1所述的方法,其中所述访问包括识别公共模式,所述公共模式包括独立于与所述数据集合相关联的任何实体或实体组的适用于主题领域的转换规则,所述公共模式建立用于理解主题领域的至少一部分的结构。
3.如权利要求2所述的方法,其中所述公共模式包括语义对象的公开定义。
4.如权利要求1所述的方法,其中所述访问包括识别私有模式,所述私有模式包括特定于实体或小于公众整体的实体组的转换规则,所述私有模式建立用于理解主题的至少一部分的结构。
5.如权利要求1所述的方法,其中所述方法还包括:
利用基于计算机的工具,建立所述源特征和所述目标特征之间的最小相似性度量;及
利用基于计算机的工具,至少部分地基于所述最小相似性度量在确定操作中删除要被考虑的源特征,其中被删除的源特征对应于所述多个模式的子集的不能超过所述最小相似性度量的目标特征。
6.如权利要求1所述的方法,其中所述方法还包括:
利用基于计算机的工具,建立所述源特征和所述目标特征之间的最小相似性度量;及
利用基于计算机的工具,至少部分地基于所述最小相似性度量从所述索引中去除至少一个映射,其中去除操作包括确定所述目标特征的能从所述索引中去除的一部分,使得所述索引中只包括与所述多个模式中能够超过所述最小相似性度量的模式对应的目标特征。
7.如权利要求1所述的方法,其中所述多个模式的子集至少包括与至少一个源特征一样的一个目标特征。
8.如权利要求7所述的方法,还包括:
给每个特征分配特征权重,其中所述特征的特征权重对应于所述特征对所述相似性度量的贡献的量度,并且其中所述源特征被分配源特征权重,并且所述目标特征被分配目标特征权重,并且其中所述源特征权重与所述目标特征权重不同。
9.如权利要求8所述的方法,其中所述特征权重至少部分地基于所述特征在所述多个模式中的频率,其中具有高于上阈值频率或低于下阈值频率的特征被给予较低的频率权重。
10.如权利要求1所述的方法,其中所述选择步骤在不参考要被转换的数据的任何特定的主题或上下文的情况下执行,或者所述选择步骤在不参考所述多个模式的主题或上下文的情况下执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380053552.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于建议校正的方法和计算系统
- 下一篇:光透导电材料





