[发明专利]基于NLP自然语言处理的中医养生智能问答系统有效
申请号: | 202110858167.1 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113590783B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 周峰;吕智慧;严绍根;陈宇;徐杨川;林榕健 | 申请(专利权)人: | 复旦大学;浙江智树网络科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/295;G06F40/30;G16H20/90 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nlp 自然语言 处理 中医 养生 智能 问答 系统 | ||
1.一种基于NLP自然语言处理的中医养生智能问答系统,用于针对用户输入的临床表现文本进行自然语言处理,从而得到对应的养生建议,其特征在于,包括:
多个用户终端,由所述用户持有;以及
管理服务器,与所述用户终端相通信连接,
其中,所述管理服务器包括中医养生文字分词模块、词性标注模块、命名实体识别与分类模块、依存关系分析模块、语义相似度计算模块以及答案检索模块,
所述中医养生文字分词模块根据预定的分词词库对所述临床表现文本进行分词处理,从而得到多个中医养生分词,
所述词性标注模块对每个所述中医养生分词进行词性标注,使得每个所述中医养生分词都有对应的词性,
所述命名实体识别与分类模块根据所述中医养生分词以及对应的所述词性,利用预先训练好的命名实体识别模型对所述中医养生分词进行命名实体识别,从而得到命名实体识别结果,并按照预定的实体类别对所述命名实体识别结果进行分类,从而使得每个所述命名实体识别结果都有对应的实体类别,
所述依存关系分析模块基于所述中医养生分词、对应的所述词性以及所述实体类别对所述临床表现文本各个成分之间的关系进行分析,从而得到临床表现文本语义,
所述语义相似度计算模块基于所述临床表现文本语义计算所述临床表现文本中的用户问题与预定的问答库中不同入库问题之间的语义相似度,从而得到所述用户问题与各个所述入库问题之间的语义相似度值,
所述答案检索模块根据所述语义相似度值利用预定的检索机制从所述问答库中检索到与所述用户问题对应的答案,作为所述养生建议。
2.根据权利要求1所述的基于NLP自然语言处理的中医养生智能问答系统,其特征在于:
其中,所述分词词库由高频词库和分割词库组成,通过如下步骤得到:
步骤S1-1,从不同中医书籍中提取中医相关文字信息;
步骤S1-2,根据所述临床表现文本中的标点字符对所述临床表现文本进行文字分割,从而得到各个文字;
步骤S1-3,统计相邻的文字在同一时刻出现的频率数量;
步骤S1-4,判断所述频率数量是否大于预定的频率阈值T;
步骤S1-5,在所述步骤S1-4判断为是时,将所述相邻的文字作为高频词生成所述高频词库,在所述步骤S1-4判断为否时,将文字作为分割词生成所述分割词库。
3.根据权利要求1所述的基于NLP自然语言处理的中医养生智能问答系统,其特征在于:
其中,所述中医养生文字分词模块对所述临床表现文本进行的分词处理包括如下步骤:
步骤S2-1,遍历所述临床表现文本中的所有相邻字符串mn,判断所述相邻字符串mn是否为高频词库中的元素;
步骤S2-2,在所述步骤S2-1判断为是时,则所述相邻字符串mn成词,在所述步骤S2-1判断为否时,则判断所述相邻字符串mn是否为分割词库的元素;
步骤S2-3,在所述步骤S2-2判断为是时,则所述相邻字符串mn不成词,在所述步骤S2-2判断为否时,计算所述相邻字符串mn之间的正向概率;
步骤S2-4,判断正向概率是否大于0.1;
步骤S2-5,在所述步骤S2-4判断为是时,则所述相邻字符串mn成词,在所述步骤S2-4判断为否时,则判断所述正向概率是否小于0.001;
步骤S2-6,在所述步骤S2-5判断为是时,则所述相邻字符串mn不成词,在所述步骤S2-5判断为否时,则计算所述相邻字符串mn的逆向概率;
步骤S2-7,判断所述逆向概率是否大于0.1;
步骤S2-8,在所述步骤S2-7判断为是时,则所述相邻字符串mn成词,在所述步骤S2-7判断为否时,则判断所述逆向概率是否小于0.001;
步骤S2-9,在所述步骤S2-8判断为是时,则所述相邻字符串mn不成词,在所述步骤S2-8判断为否时,则计算所述相邻字符串mn的相对距离;
步骤S2-10,判断所述相对距离是否在预定的阈值范围内;
步骤S2-11,在所述步S2-10判断为是时,则所述相邻字符串mn成词,在所述步S2-10判断为否时,则所述相邻字符串mn不成词,并完成针对所述临床表现文本的分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;浙江智树网络科技有限公司,未经复旦大学;浙江智树网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110858167.1/1.html,转载请声明来源钻瓜专利网。