[发明专利]一种中医细粒度证候名分割的远程监督方法有效

专利信息
申请号: 201811186683.9 申请日: 2018-10-11
公开(公告)号: CN109408831B 公开(公告)日: 2020-02-21
发明(设计)人: 王亚强;闫飞飞;王晓峰;舒红平;唐聃 申请(专利权)人: 成都信息工程大学
主分类号: G06F40/45 分类号: G06F40/45;G06F40/289;G16H20/90
代理公司: 北京元本知识产权代理事务所 11308 代理人: 常桑
地址: 610225 四川省成都市双*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 中医 细粒度 证候名 分割 远程 监督 方法
【权利要求书】:

1.一种中医细粒度证候名分割的远程监督方法,其特征在于:使用中医证候的命名和翻译惯例来训练基于中医细粒度证候名分割的条件随机场模型,首先利用汉英平行语料库中医证候的汉英字词关系,采用概率对准方法构建带噪声的标记训练数据,该概率对准方法结合正向对准和反向检查通过启发式推理来推断出中医证候中的细粒度段,然后使用这些细粒度段训练条件随机场模型;

所述远程监督方法的具体包括以下步骤:(1)用中医证候的英文翻译中的词语之间的自然分隔符来建立中医细粒度证候名分割的条件随机场的训练数据;(2)通过概率对准方法将中医症候中的中文字符与相应翻译的英文单词对准;(3)训练中医学领域基于中医细粒度证候名分割的条件随机场模型;

所述步骤(2)的概率对准方法包括:正向对准方法、反向检查方法和启发式推断方法;

所述正向对准方法用于将中医证候c中的中文字符ci与相应翻译e中的英文单词ej进行概率性对齐;在给定ci的条件下,ej的对准概率可以通过有拉普拉斯平滑的条件概率直接定义,即

其中,上式(1)中c(ej,ci)是ej和ci的共现频次,c(ci)是ci出现的频次,|Vc|是语料库中字典的数量,α≥0是拉普拉斯平滑参数,P(ej|ci)值越高表明与e中的其他英语单词相比ej与ci具有更高的关联性;

所述反向检查方法用于检查前向对准方法的结果,即ej与ci是否高可信对齐,与c中的其他中文字符相比,ci与ej也具有高可信度,反向检查定义为

在式(2)中,c(ci,ej)与式(1)中的c(ej,ci)具有相同的含义,c(ej)是ej出现的频次,|Ve|是语料库中字典的数量;所述反向检查方法也使用了拉普拉斯平滑,其中β≥0是拉普拉斯平滑参数;

所述启发式推理方法用于寻找c中最高可信度对应的最佳细粒度分割段由组成,而由与ej对准的中文字符组成,它们在e中与相同的ej对齐,且都是最高的对准概率,对准概率通过正向对准概率和反向检查概率组合测量,定义如下

其中,上式(3)中λ是平衡P(ci|ej)和P(ej|ci)概率分布的参数,如果在推断过程中存在联系,则使用启发式策略,将被设置为与之前相邻的结果相同的值;如果当前位置是c的第一位,根据经验设定为1。

2.如权利要求1所述的中医细粒度证候名分割的远程监督方法,其特征在于:所述步骤(1)具体是通过对中医症候命名风格的观察和中英翻译惯例,中医证候的细粒度片段通过中医证候相应翻译中英文单词之间的自然分隔符来识别,中医证候的细粒度片段将构成用于在中医学领域中基于中医细粒度证候名分割的条件随机场训练的标记数据。

3.如权利要求1所述的中医细粒度证候名分割的远程监督方法,其特征在于:所述步骤(3)包括分段表示、特征定义和参数设置;所述分段表示是将中医学中的中医细粒度证候名分割的任务定义为一个序列标注过程,用一个标签标记每个汉字,标签代表了一个细粒度段的特定部分,该细粒度段属于汉字,常用的有五种代表性的标签类型;所述特征定义包括n元语法特征定义和具有间隙的n元特征定义;所述条件随机场的实现是采用CRF++工具,使用拟牛顿法训练模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811186683.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top