[发明专利]一种在线医疗主题库构建方法及装置在审
申请号: | 202210256774.5 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114637737A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 阮潘;单震;张帆 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G16H40/20 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜丽洁 |
地址: | 214125 江苏省无锡市无锡经济开发区金融一街15号110*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 医疗 主题 构建 方法 装置 | ||
本发明涉及在线医疗技术领域,具体提供了一种在线医疗主题库构建方法,具有如下步骤:S1、对在线医疗平台的医院和医生公开数据进行采集;S2、对不同平台的医院和医生进行匹配识别,给医院和医生打上唯一的代码;S3、按照相应的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理;S4、构建在线医疗主题库并将经标准化处理后的数据入库。与现有技术相比,本发明通过对在线医疗数据的采集,对医院和医生识别匹配,标准化数据,构建在线医疗主题数据库,显示在线医疗现状及发展趋势,提高医疗资源利用效率、改善患者就医体验。
技术领域
本发明涉及在线医疗技术领域,具体提供一种在线医疗主题库构建方法及装置。
背景技术
近些年来,在线医疗发展迅速。通过各类平台以在线形式为相关患者服务推广互联网医疗的使用习惯。但是现有在线医疗平台多、数据体量大、使用难度高,需要建立主题库来支持应用。
如何对在线医疗数据进行处理,使其既能清晰明了的显示在线医疗情况,又能支持医院合理分配资源是迫切需要解决的问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强,设计合理,安全适用的在线医疗主题库构建方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的在线医疗主题库构建装置。
本发明解决其技术问题所采用的技术方案是:
一种在线医疗主题库构建方法,具有如下步骤:
S1、对在线医疗平台的医院和医生公开数据进行采集;
S2、对不同平台的医院和医生进行匹配识别,给医院和医生打上唯一的代码;
S3、按照行业的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理;
S4、构建在线医疗主题库并将经标准化处理后的数据入库。
进一步的,在步骤S1中,利用爬虫技术,获取不同平台的在线医疗公开数据,所述的公开数据包括医生代码、医生名称、医生科室、医生职称、在线问诊量、医生开通的在线问诊服务方式及价格、预约挂号数、患者评价、医生所属医院、医院代码、医院所属省份和城市、医院经纬度和医院地址。
进一步的,在步骤S2中,综合平台的医院省市县信息,不断补充医院的省市县,步骤如下:
S201、在线医疗平台采集到医院省市县的,直接使用采集到的省市县;
S202、未采集到医院省市县,但有采集到医院经纬度的,根据百度地图接口返回省市县;
S203、未采集到医院省市县和经纬度的,根据医院地址截取出医院省市县;
S204、未采集到步骤S101到S103信息的,根据医院名称中含有省市县进行截取补充。
进一步的,在步骤S2中,根据标准化后的平台医生信息给医院打上唯一的代码,不同平台的医院名称相同且医院所属省份一致判定为同一家医院或者医院地址完全一致的也判定为同一家医院;
一家医院的医生可能存在重名的情况,所以结合医生所属科室来判定医生,同一家医院名称同一个科室名称的同一位医生名称判定为同一位医生。
进一步的,在步骤S3中,所述在线医疗数据清洗处理包括对重复数据的清洗,取最新采集的一条记录,对补采后关键信息为空的记录进行删除。
进一步的,在步骤S3中,所述在线医疗数据进行标准化处理包括对医院省市县使用最新的行政区划代码,医院科室使用最新的医疗机构诊疗科目名录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210256774.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高速纸杯机
- 下一篇:基于人工智能的行人重识别方法、装置、设备及存储介质