[发明专利]一种众搜资源搜索方法有效

专利信息
申请号: 201410632889.5 申请日: 2014-11-12
公开(公告)号: CN104298785A 公开(公告)日: 2015-01-21
发明(设计)人: 王国军;刘湘勇;姜文君;尹鹏飞;郑瑾;张尧学 申请(专利权)人: 中南大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 长沙市融智专利事务所 43114 代理人: 欧阳迪奇
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 资源 搜索 方法
【说明书】:

技术领域

发明涉及一种众搜资源搜索方法。

背景技术

互联网的飞速发展、传感设备的普及及图像与视频的高清晰化,使得数据正在呈指数增长,大数据时代已经到来。关于数据规模到底有多大,业内专家做了这样的比喻,2011年,全球数据规模为1.8ZB,可以填满575亿个32GB的iPad,这些iPad可以在中国修建两座长城。到2020年,全球数据将达到40ZB,如果把它们全部存入蓝光光盘,这些光盘和424艘尼米兹号航母重量相当。2012年3月,美国奥巴马政府发布了“大数据研究与开发计划”,并宣布先期投资超过2亿美元的资金,用于研发大数据关键技术,以抢占数据资源开发利用的制高点。2012年5月,联合国“全球脉动”计划发布了《大数据开发:机遇与挑战》报告,英国、德国、法国、日本、加拿大等发达国家积极响应。2012年10月,中国通信学会大数据专家委员会成立,推动了我国大数据的研究与发展。2012年11月,“Hadoop与大数据技术大会”以“大数据共享与开放技术”总结了数据中的八个热点问题,大会还成立了“大数据共享联盟”,旨在搜集大数据、展示大数据,促进大数据的研究与开发。种种迹象表明,世界各国特别是发达国家都把大数据的发展摆到国家战略层面加以推动,使大数据正在成为世界新的战略资源争夺的一个新焦点。

随着大数据时代的到来,人们开始关心从各种类型的巨量数据中快速获取有价值信息的手段,大数据搜索成为其中的重要技术之一。搜索引擎经过近二十年的发展,在文本分析、关系发掘、图谱构造、用户语义理解等方面已有丰富的积累,可以作为挖掘大数据这块金矿所依赖的工具。在大数据的利用上,主要有以下几种结合传统搜索引擎的方式。第一种是个性化搜索。传统的搜索引擎很少或者基本没有考虑用户的个性化,每个用户的搜索结果都是相同的。当用户行为数据很少时,提供一致的搜索结果可能是相对较好的方案,避免了给用户提供过多冗余的信息。然而,当用户行为数据上升到一定阶段,通过对用户偏好进行建模,为用户提供个性化的搜索结果,就很有必要。因为对用户有了深层次的了解,其个性化的效果就明显了。第二种是社会化搜索。随着Facebook,Twitter,微博等社交网络的广泛流行,用户已经将其与自身生活紧密结合起来,社会化搜索有着广阔的发展前景。一方面,利用社交网络上用户的好友关系,结合传统的搜索引擎,可以为用户提供更加让人信服的搜索结果。另一方面,社会网络中有大量UGC(User Generated Content),如用户发布自己每天吃了什么东西、买了什么衣服以及去了哪些地方旅游等,将这些用户生成的内容与传统的搜索引擎结合起来,使得搜索结果与用户更加贴切。第三种是大数据环境下的众包。在大数据中,85%的是非结构化数据,而传统的搜索引擎只善于处理结构化的数据。例如,相对于计算机,人更容易区分两张图片是否相似。众包是一种全新的、分布式的组织劳动力的生产模式,基于众包的搜索指的是将那些计算机很难处理的问题通过互联网发布出去,那些具有完成任务能力的志愿军通过完成这种任务获取小额报酬或者无报酬。现实生活中利用众包进行搜索并为人们所熟知的案例是美国卫星运营商DigitalGlobe启动众包平台寻找离奇消失的马来西亚航空MH370班机的踪迹吸引上百万人协助进行“地毯式”搜索。现有的搜索方式主要关注于对资源进行建模,随着大数据时代的到来,以用户为中心对搜索者进行建模以准确把握用户需求变得极其重要,但目前的传统搜索引擎无法检索到用户自身行为所生成的资源,也就是包括用户日常生活中通过社交软件、论坛、空间等生成的资源,例如说微博说说,留言,日志,聊天记录,图片日志等等。这些数据都保存在运营商或用户终端上,无法被搜索引擎检索。同时传统搜索引擎搜索资源的时候考虑的都是资源和资源之间的相似性,没有考虑到不同用户个体之间的偏好,不能为用户提供准确的具有个人偏好性质的搜索结果。

因此,有必要设计一种高效、通用、准确和可信的用于大数据的资源搜索方法及系统。

发明内容

为了解决目前搜索引擎不能准确把握不同搜索个体的需求来提供搜索结果的技术问题,本发明提供一种具有高效、通用、准确、可信,能针对不同个体用户的特点来提供相应搜索结果的众搜资源搜索方法。

为了实现上述技术目的,本发明的技术方案是,

一种众搜资源搜索方法,包括以下步骤:

步骤一:建立众搜模型,以众搜模型为架构进行搜索;

所述的众搜模型包括开放Web资源库、用户行为资源库、设备资源库、过滤与评价模块,以及由众搜系统接口、众搜系统资源库和众搜系统用户库组成的众搜系统平台;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410632889.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top