[发明专利]异常透析数据筛选方法、装置、设备及存储介质在审
| 申请号: | 201811530683.6 | 申请日: | 2018-12-13 |
| 公开(公告)号: | CN109635112A | 公开(公告)日: | 2019-04-16 |
| 发明(设计)人: | 陈明东;黄越;胥畅 | 申请(专利权)人: | 平安医疗健康管理股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06Q40/08 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
| 地址: | 200000 上海市黄浦*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 透析 数据筛选 标准化数据 存储介质 聚类模型 聚类算法 人工智能技术 筛选 定点医疗 预先建立 预设 分析 | ||
本发明属于人工智能技术领域,公开了一种基于聚类算法的异常透析数据筛选方法、装置、设备及存储介质,该方法包括:从定点医疗机构收集待筛选的透析数据;根据预设流程对所述透析数据进行处理,获得标准化数据;通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。本发明基于聚类算法,通过透析次数聚类模型对透析数据进行筛选,提高了透析数据筛选的效率和准确性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种异常透析数据筛选方法、装置、设备及存储介质。
背景技术
目前,透析已纳入医保报销范筹,参保人在定点医疗机构进行结算时只需要支付医保报销后的费用。因此为保障医保基金的合理支出,负责管理医保的相关部门需要对参保人透析数据进行异常检测,以减少虚假报销的发生。由于需要筛选的数据量大,如果依靠人工进行筛选,则效率低,准确性不高。
发明内容
本发明提供一种异常透析数据筛选方法、装置、设备及存储介质,旨在提高透析数据筛选的效率和准确性。
为实现上述目的,本发明提供一种异常透析数据筛选方法,所述方法包括:
从定点医疗机构中获取待筛选的透析数据;
根据预设流程对所述透析数据进行处理,获得标准化数据;
通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
优选地,所述预设流程是自然语言处理NLP流程,所述根据预设流程对所述透析数据进行处理,获得标准化数据的步骤包括:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。
优选地,所述从定点医疗机构收集待筛选的透析数据的步骤之前还包括:
建立透析次数聚类模型。
优选地,所述建立透析次数聚类模型的步骤包括:
从定点医疗机构收集正常透析的历史数据;
将所述历史数据按预设流程进行处理后获得样本数据;
从所述样本数据中随机选择k个数据,所述k个数据中的每一个数据表示对应的簇的初始聚类中心,其中,k大于1;
计算所述k个数据之外的剩余样本数据与所述初始聚类中心的聚类距离;
将所述剩余样本数据分类至聚类距离最近的簇,获得重新分类的k个簇;
分别计算所述k个簇的平均值,将所述平均值更新为聚类中心;
重复更新聚类中心,直至簇的平均值不再变化,则完成了透析次数聚类模型的建立。
优选地,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤包括:
所述透析次数聚类模型对所述标准化数据进行聚类,获得聚类结果;
根据所述聚类结果计算所述标准化数据与对应聚类中心的聚类距离,将所述聚类距离与阈值进行比较;
若所述聚类距离大于所述阈值,则将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据。
优选地,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤之后还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安医疗健康管理股份有限公司,未经平安医疗健康管理股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811530683.6/2.html,转载请声明来源钻瓜专利网。





