[发明专利]一种GPT模型优化方法和装置在审
| 申请号: | 202310668189.0 | 申请日: | 2023-06-07 |
| 公开(公告)号: | CN116629385A | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 汤文巍 | 申请(专利权)人: | 汤文巍 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N5/02;G06F40/30;G06F40/289;G06F40/279;G06F16/35 |
| 代理公司: | 上海泰能知识产权代理事务所(普通合伙) 31233 | 代理人: | 宋缨 |
| 地址: | 200331 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 gpt 模型 优化 方法 装置 | ||
本发明涉及一种GPT模型优化方法和装置,方法包括:收集医学领域的相关材料;使用自然语言处理技术对所述相关材料进行语义分析,提取出所述相关材料中的专业术语、实体和关键词;根据语义分析的结果,将所述关键词和实体构造成GPT模型能够理解的提示形式;将构造好的提示形式输入至GPT模型进行训练,优化所述GPT模型。本发明能够充分学习领域知识,从而使得GPT模型能够提高预测准确率且完成更多任务。
技术领域
本发明涉及机器学习技术领域,特别是涉及一种数据模型优化方法和装置。
背景技术
当前机器学习算法在现实生活应用实例中,大多基于特定场景进行建模,基于对业务的理解搭建分类、回归模型,不断迭代减少拟合偏差。常常按照以下步骤进行:
步骤1,根据业务经验,与业务专家梳理与目标相关性较高的特征;
步骤2,获取历史数据;
步骤3,对样本特征进行特征工程(归一化、标准化等),并通过p检验、T检验或机器学习算法来筛选有效特征;
步骤4,根据业务情况,选择匹配的模型(分类模型有:LR、SVM、决策树、随机森林、XGBoost、神经网络等,回归有:回归树、神经网络);
步骤5,基于有效特征对业务目标进行建模,通过拟合偏差来判断模型有效性;
步骤6,部署模型、优化。
但是上述方法中,不同任务下训练的模型及训练数据不能通用,即每个任务都需要按照上述步骤从头到尾进行训练、优化。例如:预测客户产品购买概率、客户的违约概率、病人大病发生率、预测住院费用、各类疾病发生概率都属于不同模型,如果依次搭建模型,建模成本、维护成本都较高、相互之间知识不能迁移。
发明内容
本发明所要解决的技术问题是提供一种GPT模型优化方法和装置,能够充分学习领域知识,从而使得GPT模型能够提高预测准确率且完成更多任务。
本发明解决其技术问题所采用的技术方案是:提供一种GPT模型优化方法,包括以下步骤:
收集医学领域的相关材料;
使用自然语言处理技术对所述相关材料进行语义分析,提取出所述相关材料中的专业术语、实体和关键词;
根据语义分析的结果,将所述关键词和实体构造成GPT模型能够理解的提示形式;
将构造好的提示形式输入至GPT模型进行训练,优化所述GPT模型。
所述收集医学领域的相关材料后,还包括:按照学科和类别对所述相关材料进行分类。
所述根据语义分析的结果,将所述关键词和实体构造成GPT模型能够理解的提示形式,具体为:将提取出的医学领域的关键词和实体整理成由问题和答案组成的信息语料。
所述问题包括多种不同的提问方式。
本发明解决其技术问题所采用的技术方案是:提供一种GPT模型优化装置,包括:
收集模块,用于收集医学领域的相关材料;
语义分析模块,用于使用自然语言处理技术对所述相关材料进行语义分析,提取出所述相关材料中的专业术语、实体和关键词;
构造模块,用于根据语义分析的结果,将所述关键词和实体构造成GPT模型能够理解的提示形式;
优化模块,用于将构造好的提示形式输入至GPT模型进行训练,优化所述GPT模型。
所述的GPT模型优化装置还包括分类模块,所述分类模块用于按照学科和类别对所述相关材料进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤文巍,未经汤文巍许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310668189.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种扭转式风力发电叶片
- 下一篇:数据存储方法及相关装置





