[发明专利]中文生物医学文献数据库中敏感关键词的数据挖掘方法和系统在审
申请号: | 201410142483.9 | 申请日: | 2014-04-11 |
公开(公告)号: | CN104978347A | 公开(公告)日: | 2015-10-14 |
发明(设计)人: | 郑光;何小鹃;吕诚;姜淼;牛旭艳;何冰;梁超;刘彪;郭保生;刘进;党蕾;李德芳;张戈;吕爱平 | 申请(专利权)人: | 中国中医科学院中医临床基础医学研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 刘东方 |
地址: | 100700 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及数据发掘的方法,具体公开了中文生物医学文献数据库的“疾病-证候-症状-中药-西药”数据挖掘的方法及系统,所述方法包括:1)构建结构化的敏感关键词数据库;2)下载非结构化的主题数据,将其转换并存储到本地结构化文献数据库中;3)对数据库中敏感关键词的相关文本的挖掘和标注;4)去除数据挖掘的噪音并相应修改挖掘结果,即得相应的数据挖掘结果;所述数据挖掘系统包括:应用程序服务器(D01)、数据库服务器(D02)、挖掘结果服务器(D03)、Web服务器(D04)以及用户终端(D05)。本发明解决了现有技术中无法在中文的生物医学文献数据库中实现疾病、证候、症状、中药和西药的数据挖掘的技术难题。 | ||
搜索关键词: | 中文 生物医学 文献 数据库 敏感 关键词 数据 挖掘 方法 系统 | ||
【主权项】:
一种用于中文生物医学文献数据库中的敏感关键词数据挖掘的方法,其特征在于,所述方法包括如下步骤:1)构建结构化的能够进行数据挖掘的敏感关键词数据库,所述特征敏感关键词选自:疾病名称、证候名称、症状名称、中药名称和西药名称中的一种、两种或两种以上组合;优选疾病名称、证候名称、症状名称、中药名称和西药名称的组合;2)下载非结构化的中文生物医学文献数据库中主题数据,并将非结构化的数据转换成本地结构化的信息,存储到本地结构化文献数据库中;3)以结构化的敏感关键词数据库的标准控制词表为依据,以本地结构化的文献数据库中敏感关键词为挖掘和发现对象,通过对中文生物医学数据库的数据结构的分析以及对数据的转换和提取,整理出结构化的敏感关键词,完善敏感关键词列表,并实现对中文生物医学文献数据库中敏感关键词的相关文本的挖掘和标注;4)去除数据挖掘中的噪音,并相应修改中文文献文本的挖掘结果,即得相应的数据挖掘结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国中医科学院中医临床基础医学研究所,未经中国中医科学院中医临床基础医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410142483.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种显示控制方法、装置及终端
- 下一篇:一种网页处理方法、装置及用户终端