[发明专利]基于NLP技术的文学作品问答方法、系统及存储介质在审
| 申请号: | 202110371896.4 | 申请日: | 2021-04-07 |
| 公开(公告)号: | CN113609830A | 公开(公告)日: | 2021-11-05 |
| 发明(设计)人: | 何学智;余训兴;王家逸;林林 | 申请(专利权)人: | 新大陆数字技术股份有限公司 |
| 主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/289;G06F40/35 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 350015 福*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 nlp 技术 文学作品 问答 方法 系统 存储 介质 | ||
1.基于NLP技术的文学作品问答方法,其特征在于,包括以下步骤:
构建知识库,所述知识库中包括预设的问题模板集以及文学作品数据;
获取用户输入的提问问题;
语义分析,包括,调用算法语料库,首先对所述提问问题进行分词处理,而后对经过分词处理的提问问题进行语义特征分析、词性分析以及特定实体分析;
语义检索,包括,基于语义分析结果,计算所述提问问题与所述问题模板集中数据的相似度,根据相似度确定提问问题所对应的模板,调用知识库中文学作品数据,确定所述提问问题的答案并输出给用户。
2.如权利要求1所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述提问问题与所述问题模板集中数据的相似度计算采用BM25相似度或者JACCARD相似度或者WMD相似度。
3.如权利要求2所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述计算所述提问问题与所述问题模板集中数据的相似度前,还包括对提问问题进行关键字提取,并在相似度计算时对所述关键字进行加权处理。
4.如权利要求1所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述算法语料库包括分词库、词性库、试题库、语义模板库、以及关键词库。
5.如权利要求1所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述对经过分词处理的提问问题进行语义特征分析的方法,包括,利用正则表达式对经过分词处理的提问问题做匹配,获得所述提问问题的语义特征。
6.如权利要求1所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述对提问问题进行词性分析是采用POS技术实现。
7.如权利要求1所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述对提问问题进行特定实体分析是通过NER计算来实现。
8.如权利要求1所述的一种基于NLP技术的文学作品问答方法,其特征在于,所述文学作品数据包括古诗作品。
9.一种基于NLP技术的文学作品问答系统,包括:
知识库,所述知识库中包括预设的问题模板集以及文学作品数据;
问题获取模块,用于获取用户输入的提问问题;
语义分析模块,用于调用算法语料库,以及对所述提问问题进行分词处理、对经过分词处理的提问问题进行语义特征分析、词性分析以及特定实体分析;
语义检索模块,用于根据语义分析结果,计算所述提问问题与所述问题模板集中数据的相似度,根据相似度确定提问问题所对应的模板,调用知识库中文学作品数据,确定所述提问问题的答案并输出给用户。
10.一种可存储介质,其特征在于,包括处理器,所述处理器用于加载并执行存储介质中的指令以实现权利要求1至8中任一权利要求所述的基于NLP技术的文学作品问答方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新大陆数字技术股份有限公司,未经新大陆数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110371896.4/1.html,转载请声明来源钻瓜专利网。





