[发明专利]语言模型参数确定方法、装置和计算机设备有效

申请号：	201810907445.6	申请日：	2018-08-10
公开（公告）号：	CN109063155B	公开（公告）日：	2020-08-04
发明（设计）人：	郑洁纯;郭丽娟;麦文军;钟雪艳;张泽云	申请（专利权）人：	广州锋网信息科技有限公司
主分类号：	G06F16/00	分类号：	G06F16/00;G06F40/253;G06N3/04;G06N3/08
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	黄隶凡
地址：	510665 广东省广州市天***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语言模型参数确定方法装置计算机设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种语言模型参数确定方法，所述方法包括：获取多个样本文本，结合所述多个样本文本以及预设词库对原始语言模型进行训练获得训练语言模型；从所述预设词库中获取起始词，结合所获取到的起始词和所述训练语言模型获取生成文本，重复获取多个生成文本；将第一预设数量的所述生成文本和第二预设数量的所述样本文本输入预设分类器，获取当前分类准确率；获取当所述当前分类准确率为预设比率时所述训练语言模型的参数。本发明方案能够有效提高语言生成模型优化效率，降低成本。

技术领域

本发明涉及计算机技术领域，特别是涉及一种语言模型参数确定方法、装置和计算机设备。

背景技术

市场很多行业需要大量的行情文章、促销信息、导购文章、新产品上市等文本描述，因此正在尝试采用神经网络类型的语言模型进行语言撰写，但是在神经网络中有众多的参数对程序效果有很大的影响，有的参数影响准确率，有的参数影响训练成本，有的参数影响训练速度。

因此，需要对神经网络参数进行优化，目前市场上都是采用人工依靠过往经验进行多次调整参数来优化，但是人工优化效率低下。

发明内容

本发明的目的在于提供一种语言模型参数确定方法、装置计算机设备，能够自动确定语言生成模型的最优参数，有效提高语言生成模型优化效率，降低成本。

本发明的目的通过如下技术方案实现：

一种语言模型参数确定方法，所述方法包括：

获取多个样本文本，结合所述多个样本文本以及预设词库对原始语言模型进行训练获得训练语言模型；

从所述预设词库中获取起始词，结合所获取到的起始词和所述训练语言模型获取生成文本，重复获取多个生成文本；

将第一预设数量的所述生成文本和第二预设数量的所述样本文本输入预设分类器，获取当前分类准确率；