[发明专利]一种基于多模型集成的政务问答方法在审

申请号：	202110675321.1	申请日：	2021-06-18
公开（公告）号：	CN113342953A	公开（公告）日：	2021-09-03
发明（设计）人：	黄河燕;尤浩;魏旭;胡玥	申请（专利权）人：	北京理工大学东南信息技术研究院;中国科学院信息工程研究所
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F40/289;G06Q50/26
代理公司：	北京正阳理工知识产权代理事务所(普通合伙) 11639	代理人：	张利萍
地址：	351100 福建省***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于模型集成政务问答方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多模型集成的政务问答方法，其特征在于，包括：

S1、将政务语料文本数据Data进行多粒度划分，得到句子级上下文C^S以及篇章级上下文C^P，之后将这两种上下文和查询Q表示为word2vector词嵌入，分别记为C^S、C^P以及Q；

S2、根据所述C^S构造FAQ问答对数据库Data^F，采用BM25方法从Data^F中检索前top-k₁个BM25分数最大的候选问答对QA^Pair，之后将所述Q与QA^Pair中的每个问题使用FAQ问答对匹配模型进行匹配，若匹配成功，则将匹配分数最大的问题对应的答案作为所述Q的固定答案A^F，转S4；否则，将前top-k₂个匹配分数最大的问答对保留,作为保留的问答对，并采用问题分类模型把所述Q分类为描述型或其他类型；

S3、若查询是描述型，则基于所述C^S，采用无监督检索方法检索与所述Q相关的上下文子片段，之后将上下文子片段以及所述Q送入阅读理解模型进行分析推理，得到Q对应的抽取答案A^E；

S4、将所述C^P平铺，使用BM25方法检索与所述Q相关的文档集DS；然后根据所述C^P，采用层级检索模型从DS中检索与所述Q相关的文本，得到用于回答Q的可解释性证据E；

S5、采用无监督答案验证模型分别验证所述A^F或A^E，以及所述E，并按照预设的输出规则输出答案或所述保留的问答对作为相似问答对推荐。

2.根据权利要求1所述的方法，其特征在于，所述S1包括：

S11、多粒度划分方法包括文档划分、句子划分以及文档层次划分；记所述Data经过文档划分以及句子划分获得的句子级上下文为C^S，其包含|C^S|个文档第i个文档包含个句子记所述Data经过文档划分以及文档层级划分后的篇章级上下文为C^P，其包含|D^P|个文档第m个文档包含个篇章

S12、对于所述Q、C^S以及C^P，分词后分别得到由项组成的句子、篇章、文档以及查询；之后采用已预训练的中文词嵌入获得文本word2vector词嵌入；将所述C^S词嵌入记为C^S，所述C^P词嵌入记为C^P，将所述Q词嵌入记为Q＝[q₁；q₂；…；q|_Q]，其中|Q|为查询词嵌入Q的行数，即所述Q包含的项数，符号；表示将向量垂直连接；将所述C^S中的第j个句子S_j词嵌入记为|S_j|为句子词嵌入S_j的行数，即所述S_j包含的项数；将所述C^P中的第n个篇章P_n记为|P_n|为篇章词嵌入P_n的行数，即所述P_n包含的项数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学东南信息技术研究院;中国科学院信息工程研究所，未经北京理工大学东南信息技术研究院;中国科学院信息工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110675321.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多模型集成的政务问答方法在审

专利文献下载