[发明专利]竞争情报数据库的构建方法和系统在审
申请号: | 201811458470.7 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109582803A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 陈锦攀;胡巧明;邓雯;陈春晓;潘君镇;钟飞;尹海庆 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司电力科学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/34;G06F16/38 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510600 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情报数据库 机构信息 构建 二级机构 文档 字段 标识符 关键技术 结构级别 科技机构 数据结构 学科领域 题录 解析 关联 统计 研究 | ||
1.一种竞争情报数据库的构建方法,其特征在于,包括:
S1、获取预设格式的第一文档的文献题录数据;
S2、提取第一文档的文献题录数据中的包含机构信息的第一字段及标识符字段对应的数据;
S3、对第一字段对应的数据的数据结构进行解析,提取第一字段中的一级机构信息和二级机构信息,生成包含一级机构信息、二级机构信息和标识符字段对应的数据的第一数据表;
S4、提取第一文档的文献题录数据中包含学科领域的第二字段、包含研究主题的第三字段及包含关键技术的第四字段对应的数据;
S5、分别生成包含学科领域的第二字段及标识符字段对应的数据的第二数据表、包含研究主题的第三字段及标识符字段对应的数据的第三数据表和包含关键技术的第四字段及标识符字段对应的数据的第四数据表;
S6、根据标识符字段对应的数据,将第一数据表分别与第二数据表、第三数据表和第四数据表关联,构建第一竞争情报数据库。
2.根据权利要求1所述的竞争情报数据库的构建方法,其特征在于,步骤S3中还包括:
提取第一字段中的作者名称信息、城市名称信息和国家地区名称信息,生成包含一级机构信息、二级机构信息和作者名称信息对应的数据的第五数据表、包含一级机构信息、二级机构信息和城市名称信息对应的数据的第六数据表以及包含一级机构信息、二级机构信息和国家地区名称信息对应的数据的第七数据表;
相应地,步骤S6还包括:
根据一级机构信息和二级机构信息对应的数据,将第一数据表分别与第五数据表、第六数据表和第七数据表关联,构建第一竞争情报数据库。
3.根据权利要求2所述的竞争情报数据库的构建方法,其特征在于,步骤S6之后还包括:
S7、将第一数据表转换为条形展示图;
S8、将第二数据表、第三数据表、第四数据表、第五数据表、第六数据表和第七数据表分别转换为第一树状展示图、第二树状展示图、第三树状展示图、第四树状展示图、第五树状展示图和第六树状展示图;
S9、根据第一数据表与第二数据表、第三数据表、第四数据表、第五数据表、第六数据表和第七数据表的关联关系,建立条形展示图、第一树状展示图、第二树状展示图、第三树状展示图、第四树状展示图、第五树状展示图和第六树状展示图之间的联动竞争情报数据模型。
4.根据权利要求3所述的竞争情报数据库的构建方法,其特征在于,步骤S6之后还包括:
根据第二数据表、第三数据表、第四数据表、第五数据表、第六数据表和第七数据表的共现关系,生成科学知识图谱。
5.根据权利要求4所述的竞争情报数据库的构建方法,其特征在于,所述生成科学知识图谱之后还包括:
获取根据预设格式的第二文档构建的第二竞争情报数据库;
根据第二文档的一级机构信息和二级机构信息,将第二竞争情报数据库与第一竞争情报数据库关联,构建多维竞争情报数据库。
6.一种竞争情报数据库的构建系统,其特征在于,包括:
第一获取单元,用于获取预设格式的第一文档的文献题录数据;
第一提取单元,用于提取第一文档的文献题录数据中的包含机构信息的第一字段及标识符字段对应的数据;
第一建表单元,用于对第一字段对应的数据的数据结构进行解析,提取第一字段中的一级机构信息和二级机构信息,生成包含一级机构信息、二级机构信息和标识符字段对应的数据的第一数据表;
第二提取单元,用于提取第一文档的文献题录数据中包含学科领域的第二字段、包含研究主题的第三字段及包含关键技术的第四字段对应的数据;
第二建表单元,用于分别生成包含学科领域的第二字段及标识符字段对应的数据的第二数据表、包含研究主题的第三字段及标识符字段对应的数据的第三数据表和包含关键技术的第四字段及标识符字段对应的数据的第四数据表;
建库单元,用于根据标识符字段对应的数据,将第一数据表分别与第二数据表、第三数据表和第四数据表关联,构建第一竞争情报数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司电力科学研究院,未经广东电网有限责任公司;广东电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811458470.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实体嵌入方法、装置、介质及设备
- 下一篇:一种动画播放方法