[发明专利]一种提供招投标信息搜索服务的方法和装置在审
申请号: | 201610046482.3 | 申请日: | 2016-01-25 |
公开(公告)号: | CN105718580A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 庞宇科 | 申请(专利权)人: | 江苏国泰新点软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/06 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 215600 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提供 投标 信息 搜索 服务 方法 装置 | ||
技术领域
本发明涉及招投标领域,特别涉及一种提供招投标信息搜索服务的方法 和装置。
背景技术
信息化的发展带来了招投标领域的新局面,原来投标人主要通过期刊杂 志获取项目招投标信息的方式转变成了通过互联网网站来获取适合自己投标 的信息。投标人的一种做法是登录各地的各个招投标网站来获取信息,然后 通过人工的方式一个个检索并排查需要的信息。另外一种更加高效的做法是 登录一些大型的招投标信息网站,通过全文检索的方式去搜索需要的招投标 信息。
然而,这种方式耗时耗力,同时招投标网站的自带搜索也不能保证质量, 这就造成了错误或者遗漏了重要信息。而通过登录大型的招投标信息网站, 通过全文检索的方式去搜索需要的招投标信息,也由于采用了模糊匹配算法, 匹配的质量不高,造成的搜索出的无效数据大于有效数据,更可怕的是遗漏 了更多的有价值信息。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分 地解决上述问题的一种提供招投标信息搜索服务的方法和装置。
依据本发明的一个方面,提供了一种提供招投标信息搜索服务的方法, 包括:
从互联网中爬取招投标信息源数据保存到第一数据库中;
从第一数据库中的源数据中提取关键数据保存到第二数据库中;
接收招投标信息查询请求,根据查询请求中的关键字查询所述第二数据 库,如果存在匹配项,根据该匹配从第二数据库中获取相应的一个或多个关 键数据进行展示。
可选地,所述招投标信息源数据为网页源代码。
可选地,所述从第一数据库中的源数据中提取关键数据保存到第二数据 库中包括如下中的一种或多种:
从第一数据库中的网页源代码中,提取符合第一预设逻辑的字符串作为 发布日期关键元数据;其中第一预设逻辑为:字符串位于网页源代码中内容 content部分的尾部,和/或字符串匹配/前缀匹配第一指定字符或第一指定字 符串;
从第一数据库中的网页源代码中,提取符合第二预设逻辑的字符串作为 招标人关键元数据;其中第二预设逻辑为:字符串前缀匹配第二指定字符或 第二指定字符串;
从第一数据库中的网页源代码中,提取符合第三预设逻辑的字符串作为 招标代理关键元数据;其中第三预设逻辑为:字符串前缀匹配第三指定字符 或第三指定字符串;
从第一数据库中的网页源代码中,提取符合第四预设逻辑的字符串作为 投资金额关键元数据;其中第四预设逻辑为:字符串前缀匹配第四指定字符 或第四指定字符串,和/或,字符串位于网页源代码中content部分中的表格 table部分且该table部分的表头部分的字符串匹配第五指定字符或第五指定 字符串;
从第一数据库中的网页源代码中,提取符合第五预设逻辑的字符串作为 第一/二/三中标候选人关键元数据;其中第五预设逻辑为:字符串位于网页 源代码中内容部分中的table部分,且字符串对应的表格的行/列名称匹配第 六指定字符或第六指定字符串;
从第一数据库中的网页源代码中,提取符合第六预设逻辑的字符串作为 第一/二/三中标价关键元数据;其中第六预设逻辑为:字符串位于网页源代 码中内容部分中的table部分,且字符串对应的表格的行/列名称匹配第七指 定字符或第七指定字符串;
从第一数据库中的网页源代码中,提取符合第七预设逻辑的字符串作为 中标人关键元数据;其中第七预设逻辑为:字符串前缀匹配第八指定字符或 第八指定字符串;
从第一数据库中的网页源代码中,提取符合第八预设逻辑的字符串作为 中标价关键元数据;其中第八预设逻辑为:字符串前缀匹配第九指定字符或 第九指定字符串;
从第一数据库中的网页源代码中,提取符合第九预设逻辑的字符串作为 企业名称关键元数据;其中第九预设逻辑为:字符串前缀匹配第十指定字符 或第十指定字符串。
可选地,所述从第一数据库中的源数据中提取关键数据保存到第二数据 库中进一步包括:
对提取的关键元数据进行校验,将通过校验的关键元数据保存到第二数 据库中;每种关键元数据使用对应的校验逻辑进行校验;
当提取的关键元数据为发布日期关键元数据时,采用的校验逻辑为:提 取的关键元数据不大于当前日期;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏国泰新点软件有限公司,未经江苏国泰新点软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610046482.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于Redis的数据调用方法及其系统
- 下一篇:栅介电层的制造方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置