[发明专利]数据处理方法、医学用语处理系统和医学诊疗系统有效
申请号: | 201710642037.8 | 申请日: | 2017-07-31 |
公开(公告)号: | CN107480135B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 张振中 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/30;G06F16/33;G16H50/20 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 黄威;喻嵘 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 医学 用语 处理 系统 诊疗 | ||
本发明实施例提供了一种数据处理方法、医学用语处理系统和医学诊疗系统,其中所述方法包括:获取用户输入的语句信息;利用预设算法将所述语句信息划分为多个信息片段,所述多个信息片段包括第一信息片段;建立各个信息片段的高斯分布;利用相似度模型计算所述第一信息片段与数据库中的词语之间的相似度;获取至少一个用于描述所述第一信息片段的第二信息片段。本发明能够提供大众用语对应的医学用语,方便用户诊疗。
技术领域
本发明实施例涉及医学技术领域,特别涉及一种数据处理方法、医学用语处理系统和医学诊疗系统。
背景技术
我国每年就诊人数多,导致医院一直超负荷运行,给就诊人员以效率低下的感觉。如果使用人工智能系统来提高健康医疗服务的效率和自动化程度,就能一定程度上缓解这一情况。然而在使用人工智能系统来提高医疗服务效率时,通常会面临一个严重的问题:由于病人缺乏一定的医学知识以及语言的复杂性,病人在自述疾病症状时错误太多(如描述错误、用词错误、有意无意忽略),此时单纯匹配书面症状和医学名词会导致误诊。一个简单的例子,医学文献中描述感冒产生的症状时使用“鼻塞”,而现实中病人在描述症状时会用到“鼻子堵了”和“鼻腔不通气”。从这个例子中可以看到,医学用语和大众用语之间存在一定的差异,如果单纯地依靠字面词形匹配会导致误诊情况的发生。因此,如果能够提供一种能够根据病人提供的信息提供相关的医学专业用语,则能大大的提供就诊效率以及避免误诊的情况。
发明内容
本发明实施例提供了一种能够根据输入的语句而获得与该语句相近的医学专业用语的数据处理方法、医学用语处理系统和医学诊疗系统。
为了解决上述技术问题,本发明实施例提供了如下的技术方案:
一种数据处理方法,应用于诊疗系统中,其特征在于,包括:
获取用户输入的语句信息;
利用预设算法将所述语句信息划分为多个信息片段,所述多个信息片段包括第一信息片段;
建立各个信息片段的高斯分布;
利用相似度模型计算所述第一信息片段与数据库中的词语之间的相似度;
获取至少一个用于描述所述第一信息片段的第二信息片段。
作为优选实施例,所述利用预设算法将所述语句信息划分为多个信息片段包括:
利用自然语言处理算法按照词性将所述语句信息划分成多个信息片段。
作为优选实施例,其中建立各信息片段的高斯分布包括:
以矩阵的形式表示各个所述信息片段的高斯分布;
利用随机梯度下降算法计算各个所述信息片段的高斯分布的协方差和期望值;
基于计算得到的协方差和期望值建立高斯分布。
作为优选实施例,其中,所述以矩阵的形式表示各个所述信息片段的高斯分布包括:
所述高斯分布为多维高斯分布,并且所述矩阵形式的多维高斯分布的表达式为N(μw,∑w),
其中,∑w表示信息片段w的高斯分布的协方差,uw表示信息片段w的高斯分布的期望。
作为优选实施例,其中利用随机梯度下降算法计算各个所述信息片段的高斯分布的协方差和期望值包括:
通过求解目标函数最小化的方式计算所述协方差和期望值,其中目标函数的表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710642037.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和系统
- 下一篇:一种应用于电影剧本中情感曲线分析的方法