[发明专利]基于GPT2的云ERP社区生成式问答方法在审

申请号：	202210596783.9	申请日：	2022-05-26
公开（公告）号：	CN115062003A	公开（公告）日：	2022-09-16
发明（设计）人：	廖伟智;黄明彤;阴艳超	申请（专利权）人：	电子科技大学
主分类号：	G06F16/215	分类号：	G06F16/215;G06F16/332;G06N3/04;G06N3/08
代理公司：	成都启慧金舟知识产权代理事务所(特殊普通合伙) 51299	代理人：	何媛
地址：	610000 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 gpt2 erp 社区生成问答方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于GPT2的云ERP社区生成式问答方法，其特征在于，包括以下步骤：

(1)对云ERP社区人工客服数据脱敏与清洗去噪；

(2)建立云ERP社区客服数据驱动服务；

(3)构建基于Transformer的无监督训练；

(4)构建基于Transformer解码器的GPT2模型；

(5)构建基于GPT2的生成式问答模型。

2.根据权利要求1所述的基于GPT2的云ERP社区生成式问答方法，其特征在于，所述脱敏和清洗去噪的算法流程为：首先读取云ERP生态社区中知识库和人工客服会话原始数据，然后添加所需脱敏的敏感信息类别，读取客户信息并设置敏感信息替换规则，在此基础上，对原始数据遍历脱敏得到脱敏后的文本数据；添加待清洗噪声类别、读取所需信息，并设置相应的正则表达式清洗函数，然后遍历数据进行清洗，最后得到脱敏清洗去噪后的知识库三元组以及客服对话数据，并存入数据库。

3.根据权利要求1所述的基于GPT2的云ERP社区生成式问答方法，其特征在于，所述步骤(2)先从数据库中提取出步骤(1)中处理好的云ERP人工客服会话数据，然后提取其中的相关信息，在此基础上建立客服会话数据集，将数据集和提取到的信息进行封装，最后初始化并启动客服数据驱动服务。

4.根据权利要求1所述的基于GPT2的云ERP社区生成式问答方法，其特征在于，所述步骤(3)中给定一个无监督的标记语料库U＝{u₁，...，u_n}，使用标准语言建模目标来最大化以下可能性，如式1：

L₁(U)＝∑_ilogP(u_i|u₁，......，u_k-1；θ) (1)

式中k是上下文窗口的大小，条件概率P使用神经网络建模参数为θ的网络，这些参数是使用随机梯度下降训练的，然后使用多层Transformer解码器作为语言模型，解码器是Transformer的变体，该模型在输入上下文标记上应用多头自注意操作，然后是位置前馈层，以在目标标记上产生输出分布如下式：

m₀＝UW_e+W_p

(2)

式中将n个词的词嵌入W_e加上位置嵌入W_p，输入Transformer中，n个输出分别预测该位置的下一个词，输入用m₀表示，0代表初始输入层，m₀的计算公式能够看出GPT是单向的语言模型，得到m₀后，将m₀依次传入Transformer所有的解码器中，最终得到m_n，最后通过下式：

P(u)＝Softmax(m_nW_e^T) (4)

式中最后将得到的m_n输入softmax函数进行求解，得到最终的无监督预训练结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210596783.9/1.html，转载请声明来源钻瓜专利网。

上一篇：基于RGB-D相机和视觉定位的水果定位方法、系统、设备及介质
下一篇：一种绝缘子缺陷检测模型构建方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于GPT2的云ERP社区生成式问答方法在审

专利文献下载