[发明专利]一种基于异常流泪特征认知的建模方法有效

专利信息
申请号: 202011034647.8 申请日: 2020-09-27
公开(公告)号: CN112182213B 公开(公告)日: 2022-07-05
发明(设计)人: 杜登斌 申请(专利权)人: 中润普达(十堰)大数据中心有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/216;G06F40/289;G06F40/30;G16H50/30;G16H50/70
代理公司: 武汉红观专利代理事务所(普通合伙) 42247 代理人: 李季
地址: 442000 湖北省十堰市张*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 异常 流泪 特征 认知 建模 方法
【说明书】:

发明提供了一种基于异常流泪特征认知的建模方法,包括采集泪液分泌异常的症状及相关文献,获取导致泪液分泌异常的各种症状及所有可能的原因的特征信息;针对泪液分泌异常的各种症状及各症状原因的特征信息进行分词;对分词后的内容进行TF—IWF筛选,删除其中的停用词,并提取关键词;将提取的关键词作为测试数据和类别标签,标签构建样本库;利用原型网络进行小样本学习,将样本库分为训练集和测试集,求取类别标签对应的原型和测试数据属于某一类别标签的概率;对进行了类别标签关联的测试数据和类别标签的关键词,采用自适应增强学习算法进一步进行分类训练和优化。

技术领域

本发明涉及大数据分析技术领域,尤其涉及一种基于异常流泪特征认知的建模方法。

背景技术

泪液分泌异常是由多种可能因素引发的现象,除了精神受到外部刺激和异物的反射刺激外,某些药物的刺激、眼部疾病如青光眼、眼睑、结膜或者虹膜疾病,以及三叉神经、面神经受刺激也会导致泪分泌异常;另外,泪液的排泄系统异常,如泪小点位置异常、鼻泪管堵塞、泪道功能不全,以及气候、环境以及过敏等都会导致泪液分泌异常。泪液分泌异常作为一种外在表现,通常是由一种原因诱发或者多种原因共同诱发。

分类技术是机器学习中非常重要的技术之一,其目标是根据数据的特征将数据归属到相应的标签类型中,在传统的分类中,一个数据仅划分一个标签类别,这种划分并不够精确。随着数据包含的信息越来越丰富,数据内容也越来越复杂和多样。为充分表达数据的多样性和多义性,采用多个标签描述数据是很常见的手段。通过对异常流泪表达获取的症状描述和内因数据是典型的多种标签输出类型,利用对其数据实现机器学习,提高对多标签数据分类的准确度,对复杂输入的精确表达具有较大帮助。

发明内容

有鉴于此,本发明提出了一种基于异常流泪特征,且能对采集文本有效取词并提取关键字、筛选高频关键词进行小样本训练,并对训练结果进行优化的认知的建模方法。

本发明的技术方案是这样实现的:本发明提供了一种基于异常流泪特征认知的建模方法,包括如下步骤:

S1:采集泪液分泌异常的症状及相关文献,获取导致泪液分泌异常的各种症状及所有可能的原因的特征信息;

S2:针对泪液分泌异常的各种症状及各症状原因的特征信息进行分词;

S3:对上一步分词后的内容进行TF—IWF筛选,删除其中的停用词,并提取关键词;

S4:对上一步提取的泪液分泌异常的各种症状关键词作为测试数据,各症状原因关键词作为测试数据的类别标签,利用测试数据和类别标签构建样本库;

S5:利用原型网络进行小样本学习,将样本库分为训练集和测试集,求取类别标签对应的原型和测试数据属于某一类别标签的概率;

S6:对上一步进行了类别标签关联的测试数据和类别标签的关键词,采用自适应增强学习算法进一步进行分类训练和优化。

在以上技术方案的基础上,优选的,所述针对泪液分泌异常的各种症状及各症状原因的特征信息进行分词,是基于词典的分词,采用逆向最大匹配法;每次去句子末端的四个字作为匹配字段,如果匹配失败,则去掉匹配字段最前面的一个字继续与词典匹配,直到完成特征信息的分词。

进一步优选的,所述对分词后的内容进行TF—IWF筛选,是统计分词后的各词语在各种症状及各症状原因的特征信息中出现的频率,以及特定的词语的逆向文件频率;

两者的积TF*IWF为各词语在分词后的内容中的重要度,根据《中文停用词词表》删除停用词后,根据上述重要度排序选取剩余分词后的词语内容的10%—20%作为关键字。

进一步优选的,所述基于词典的分词,其采用的词典是自建的中文分词词典,或者汉字词法分析系统ICTCLAS。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中润普达(十堰)大数据中心有限公司,未经中润普达(十堰)大数据中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011034647.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top