[发明专利]一种基于深度学习的中文病案分词方法在审
| 申请号: | 202010312483.4 | 申请日: | 2020-04-20 |
| 公开(公告)号: | CN111523320A | 公开(公告)日: | 2020-08-11 |
| 发明(设计)人: | 刘勇国;郑子强;杨尚明;李巧勤 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06N3/04;G06N3/08 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种基于深度学习的中文病案分词方法,分别构建中医领域词典及字嵌入字典;构建中医病案字符的特征向量;利用双向长短期记忆网络BiLSTM分别对所述特征向量和字嵌入字典中字符的字向量进行编码;将编码后的两部分隐藏状态进行级联;利用CRF层进行分词序列预测,得到预测标签序列,并对预测标签序列进行评分;利用随机梯度下降法最小化预测标签序列与真实标签序列之间的误差,将评分最高的序列作为预测序列。本发明实现了上下文信息和局部信息相融合,有效识别在中医病案训练数据中没有出现过的生词问题,能够有效解决歧义问题,同时,本发明可以通过替换库文本和词典,直接应用于其他领域,具有特定领域普遍适用性。 | ||
| 搜索关键词: | 一种 基于 深度 学习 中文 病案 分词 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010312483.4/,转载请声明来源钻瓜专利网。





