[发明专利]基于伪种子属性和随机漫步排序的语义属性自动抽取方法及实现该方法的系统有效

申请号：	201210118461.X	申请日：	2012-04-20
公开（公告）号：	CN102663123A	公开（公告）日：	2012-09-12
发明（设计）人：	杨沐昀;孙叔琦;李生;赵铁军	申请（专利权）人：	哈尔滨工业大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	张宏威
地址：	150001 黑龙***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	基于伪种子属性和随机漫步排序的语义属性自动抽取方法及实现该方法的系统，涉及信息检索技术领域，具体涉及语义检索技术。本发明解决了现有基于上下文相似度和查询日志的语义属性词自动识别方法存在的人工介入程度高、种子属性上下文分布和语料中潜在属性词不匹配的问题。本发明首先根据待检索的语义类信息过滤查询日志提取伪种子属性；同时，根据待检索的语义类遍历检索日志生成候选属性或伪种子属性及其上下文候选数据的集合；并根据获得的候选属性或伪种子属性及其全部上下文构建属性-上下文图；最后采用基于随机漫步的权重传播算法计算所有候选属性的权重，并根据所述权重排序，抽取前Y个候选属性作为待检索的语义类对应的语义属性。
搜索关键词：	基于种子属性随机漫步排序语义自动抽取方法实现系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

基于伪种子属性和随机漫步排序的语义属性自动抽取方法，其特征在于该方法的过程为：首先，根据待检索的语义类信息过滤查询日志，提取伪种子属性，获得伪种子属性集合S，该伪种子属性集合中的伪种子属性的权重作为随机漫步算法的初始状态参数；同时，根据待检索的语义类遍历检索日志，生成候选属性或伪种子属性及其上下文候选数据的集合；并根据获得的候选属性或伪种子属性及其全部上下文，构建属性‑上下文图；然后，根据伪种子属性以及属性上下文图，采用基于随机漫步的权重传播算法计算所有候选属性的权重，然后根据所述权重对所有候选属性进行排序，然后抽取前Y个候选属性作为待检索的语义类对应的语义属性，所述Y为正整数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学，未经哈尔滨工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210118461.X/，转载请声明来源钻瓜专利网。

上一篇：一种针对多视频序列的运动推断结构方法
下一篇：一种醋酸酯生产乙醇并选择性联产2-丁醇的工艺及其配套工艺系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于伪种子属性和随机漫步排序的语义属性自动抽取方法及实现该方法的系统有效

专利文献下载