[发明专利]基于伪种子属性和随机漫步排序的语义属性自动抽取方法及实现该方法的系统有效
申请号: | 201210118461.X | 申请日: | 2012-04-20 |
公开(公告)号: | CN102663123A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 杨沐昀;孙叔琦;李生;赵铁军 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张宏威 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 种子 属性 随机 漫步 排序 语义 自动 抽取 方法 实现 系统 | ||
1.基于伪种子属性和随机漫步排序的语义属性自动抽取方法,其特征在于该方法的过程为:
首先,根据待检索的语义类信息过滤查询日志,提取伪种子属性,获得伪种子属性集合S,该伪种子属性集合中的伪种子属性的权重作为随机漫步算法的初始状态参数;
同时,根据待检索的语义类遍历检索日志,生成候选属性或伪种子属性及其上下文候选数据的集合;并根据获得的候选属性或伪种子属性及其全部上下文,构建属性-上下文图;
然后,根据伪种子属性以及属性上下文图,采用基于随机漫步的权重传播算法计算所有候选属性的权重,然后根据所述权重对所有候选属性进行排序,然后抽取前Y个候选属性作为待检索的语义类对应的语义属性,所述Y为正整数。
2.根据权利要求1所述的基于伪种子属性和随机漫步排序的语义属性自动抽取方法,其特征在于,根据伪种子属性以及属性上下文图,采用基于随机漫步的权重传播算法计算所有候选属性的权重的过程中,将伪种子属性节点拥有的权重作为权重传播算法计算过程中的初始状态下的权重,例如:所述权重为1。
3.根据权利要求1所述的基于伪种子属性和随机漫步排序的语义属性自动抽取方法,其特征在于,基于随机漫步的权重传播算法中,权重传播在随机漫步的过程中传播过程为:
第一步,从候选属性节点漫步至与该候选属性对应的上下文节点:
公式中,n为根据待检索的语义类信息获得的所有候选属性的总数,m为获得的上下文的总数,φ1(i)表示t=1时刻第i个上下文的得分,w(vk,ui)表示第i个候选属性节点ui与第k个上下文节点vk之间的共现强度,ψ0(k)表示t=0时刻第k个候选属性的得分;
第二步,从上下文节点漫步回属性节点:
公式中,ψ1(j)表示t=1时刻第j个候选属性的得分,w(uk,vj)表示与第k个上下文节点vk和第i个候选属性节点ui之间的共现强度,φ1(k)表示t=1时刻第k个上下文的得分。
4.根据权利要求1所述的基于伪种子属性和随机漫步排序的语义属性自动抽取方法,其特征在于,在遍历查询日志的过程中,采用如下列模式之一的模式进行查询:
[实例][上下文][候选属性或伪种子属性]
[实例][候选属性或伪种子属性][上下文]
[实例][上下文-1][候选属性或伪种子属性][上下文-2]
[实例][候选属性或伪种子属性]
在满足上述模式之一的查询中,用占位符“-”表示实际查询中的[实例]以及[候选属性或伪种子属性],形成对应[候选属性或伪种子属性]上下文,与上述四种模式对应的上下文形式分别是:
“-[上下文]-”
“--[上下文]”
“-[上下文]-[上下文]”,
“ --”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210118461.X/1.html,转载请声明来源钻瓜专利网。