[发明专利]医疗文书的HMM输入法模型的训练方法、输入法模型和输入方法有效
申请号: | 201911265899.9 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111090338B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 王兴维;邰从越;刘龙;史黎鑫;刘慧芳;王慧 | 申请(专利权)人: | 心医国际数字医疗系统(大连)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/284;G06F40/289;G16H15/00 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 马庆朝;刘鑫 |
地址: | 116023 辽宁省大连市高新技*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文书 hmm 输入法 模型 训练 方法 输入 | ||
医疗文书的HMM输入法模型的训练方法、输入法模型和输入方法,属于医疗信息领域,用于解决在医疗术语输入时遇到长串输入时导致的输出预期结果的概率很低的问题,要点是对训练用医疗文书内容按照单字分词,并统计每个词出现的概率,作为HMM模型的初始状态概率;将训练用医疗文书中的所有汉字都转换为对应的拼音,统计每个拼音对应的汉字以及各自出现的概率,作为HMM模型的观察状态发射概率;统计训练用医疗文书中每个汉字后面出现的其他汉字的概率,作为HMM模型的隐藏状态转移概率,效果是提升了长串输入的结果准确度。
技术领域
本发明属于医疗信息领域,涉及一种医疗文书的HMM输入法模型的训练方法、输入法模型和输入方法。
背景技术
随着医疗信息化、智能化的发展,医生在办公过程中需要进行越来越多的文本输入操作,如病历、医嘱等医学文书,这一过程中,医生需要使用一定的输入法进行文本内容的输入。
目前大多数医生使用的输入法主要有两种:一种是通用的输入法,如搜狗输入法、百度输入法等,另一种则是基于词库的医疗输入法。
医生工作过程中由于需要输入大量的专有术语、名词,以及专科知识等内容,使用现有的通用输入法会耗费大量的时间在人工选择候选词条的过程中,导致输入时间长,效率低,且容易出错。而基于词库的医疗输入法,虽然可以在一定程度上解决专有名词的输入效率问题,但由于词库多为限制长度的固定短语,导致医生在一次性输入较长内容时,仍然面临候选词条与上下文相差较远,需人工进行大量选择操作从而导致效率低下的问题。
目前常见的医疗输入法,多是采用在通用输入法的基础上通过特定的方法增加医疗专用词典的方式实现,词典一般存储在本地硬盘或云端服务器。其主要过程为:首先获取用户输入的拼音串;之后,根据输入的拼音串,在专用词库中进行匹配;如果在医疗专用词库中匹配到符合输入拼音串的短语内容,则将其作为优先级较高的候选结果返回;继续使用通用算法进行输入拼音串和候选汉字之间的转换,结果优先级低于医疗专用词库中的检索结果;将上述两部分候选结果进行组合排序,并返回到输入法界面供用户选择。
以上为常见的医疗输入法中,拼音到汉字转换过程中的基本流程,部分医疗输入法可能会加入诸如规则验证等其他操作,但并不会改变基本流程。在上述常见拼音输入法的拼音补全过程中,遇到长串输入时输出预期结果的概率很低的问题,影响医生的工作效率。
发明内容
为了解决上述现有技术存在的问题,本发明提出了一种医疗文书的HMM输入法模型的训练方法,包括:
获取所有合法拼音串作为HMM模型的观察状态集合,并获取拼音串对应的所有汉字结果作为HMM模型的隐藏状态集合;
对训练用医疗文书内容按照单字分词,并统计每个词出现的概率,作为HMM模型的初始状态概率;
将训练用医疗文书中的所有汉字都转换为对应的拼音,统计每个拼音对应的汉字以及各自出现的概率,作为HMM模型的观察状态发射概率;
统计训练用医疗文书中每个汉字后面出现的其他汉字的概率,作为HMM模型的隐藏状态转移概率。
本发明还涉及一种由所述的训练方法得到的HMM输入法模型。
本发明还涉及一种HMM输入法模型,包括:
观察状态集合模块,是获取的所有合法拼音串,
HMM模型的隐藏状态集合模块,是获取拼音串对应的所有汉字结果,
初始状态概率分布模块,是对训练用医疗文书内容按照单字分词,并统计每个词出现的概率分布,
观察状态发射概率分布模块,是将训练用医疗文书中的所有汉字都转换为对应的拼音,统计每个拼音对应的汉字以及各自出现的概率分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于心医国际数字医疗系统(大连)有限公司,未经心医国际数字医疗系统(大连)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911265899.9/2.html,转载请声明来源钻瓜专利网。