[发明专利]一种互联网信息通用结构化精准搜索方法无效
申请号: | 201410368807.0 | 申请日: | 2014-07-30 |
公开(公告)号: | CN104090988A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 刘莎 | 申请(专利权)人: | 刘莎 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400041 重庆市九*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 信息 通用 结构 精准 搜索 方法 | ||
技术领域
本发明涉及计算机及通信领域,特别是涉及到一种互联网信息通用结构化精准搜索方法。
背景技术
在互联网信息搜索领域,如何实现网页信息的精准搜索,实现网页信息和各类结构化信息并行搜索,一直是没有得到有效解决的两个重大问题。相关技术人员在此类问题上提出了各种解决方案,但其信息搜索精准度和普遍适用性都尚未得到实质性解决。
为了根本解决上述问题,我们从全文关键搜索结果中随机抽取互联网信息摘要进行统计分析,从中发现了互联网信息的通用组织结构“双十定律:无论在全文关键词搜索框中输入任意关键字(如:国家发改委、XX公司、智能手机、普金、 世界杯 ……),其相关信息的高频分类均在10项左右。如:新闻、告示、知识、产品、服务、交往、点播、下载、博客、论坛、大黄页、其它。而每个分类下的高频信息组织结构词也在10项左右:如,“新闻”类信息的高频通用组织结构词包括:标题、主体、行为、时间、地点、背景、评论、综述....;“交往”类信息(如招聘、应聘、征婚、交友)的高频通用组织结构词均包括:交往目的、年龄、性别、学历、职业、性格、爱好.....。(见图1)
在此有重大实用意义的发现基础上,本发明提供了一种互联网信息通用结构化精准搜索方法,以达到实现各类互联网信息通用结构化精准搜索的目的。
发明内容
一种互联网信息通用结构化精准搜索方法,其目的在于实现各类互联网信息通用的结构化精准搜索。其发明内容包括:
通过互联网信息发布通用结构模板获得发布信息的方法如下:
获得用户注册代码,
输出互联网信息发布通用结构模版,
在互联网信息发布通用结构模版上直接获得用户输入或选择的主题关键词、通用组织结构词、通用组织结构词下的输入内容,
和/或,
获得用户将互联网信息发布通用结构模版上的组织结构词直接添加至各类非结构化信息中的结果,
将获得的上述内容存储于通用结构数据库;
将获得的发布内容存储于通用结构数据库时,如果获得的发布信息是某用户在互联网信息发布通用结构模版上自主添加的组织结构词分类词、组织结构词及指示内容,则将其全部转换为通用组织结构分类项“其它”下的内容,并添加专用代码。
通过互联网信搜索通用结构模板进行信息搜索的方法如下:
为通用结构数据库数据建立全文索引,并且索引中包含有各类索引关键词关系代码,
在互联网信息搜索通用结构模版上获得搜索用户选择的通用组织结构词,输入的主题关键词及通用组织结构词下的关键词;
用获得的各类搜索关键词匹配发布信息全文索引中的各类关键词,
当搜索关键词与发布信息中的关键词匹配成功时,在摘要数据库中调用对应信息,
根据匹配成功的发布信息中的各类关键词的权重条件、匹配度、匹配成功数量等条件将搜索结果进行排序和输出。
其中,
当用获得的各类搜索关键词匹配发布信息全文索引中的各类关键词时,如果获得的搜索指令是从用户自建网站中获得的“站内搜索”指令,并且在互联网信息通用摘要数据库中,匹配成功的信息是信息发布通用结构模版“其它”项下的新增组织结构词或所指示内容,则根据添加的关系代码标注,在输出显示时将匹配成功信息中的新增结构词及指示内容转换为该用户网站内的新增结构词及指示内容。
附图说明
图1、互联网信息的通用组织结构“双十定律”示意图
图2、本发明主流程A
图3、本发明主流程B
图4、互联网信息发布通用结构模示意图
图5、互联网信息搜索通用结构模板示意图
图6、用信息发布通用结构模板中的组织结构词标注网页信息示意图
图7、新增组织结构词及指示内容转换示意图
在本发明中,
所述互联网信息发布、搜索通用组织结构模板中预设有主题关键词输入框、通用组织结构词,通用组织结构词下的关键词输入框。其中,主题关键词是用于指示互联网发布、搜索信息主题的任意关键词,通用组织结构词是用于指示任意主题关键词所指示目标信息的功能与效用范围的常用高频关键词的分类集合,通用组织结构词下的关键词输入框是指可以在通用组织结构词下输入任意文字或符号内容的输入框(见图4中的组织结构词对应的输入框,图5中的组织结构词后紧跟的输入框示意“()”。)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘莎,未经刘莎许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410368807.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置