[发明专利]一种信息处理方法、装置及计算机可读存储介质有效

申请号：	202010905735.4	申请日：	2020-09-01
公开（公告）号：	CN112052320B	公开（公告）日：	2023-09-29
发明（设计）人：	周辉阳;闫昭;李勤	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/35;G06F16/36;G06F40/30
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	李汉亮
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信息处理方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种信息处理方法，其特征在于，包括：

根据目标语料信息生成多个测试语料信息；其中，所述目标语料信息为人工设定的相似问题加答案信息的组合，所述测试语料信息为扩展问题的语料信息；

对每一测试语料信息与所述目标语料信息对应的初始语料信息进行组合，生成测试语料信息对；其中，所述初始语料信息为人工设定的问题；

通过第一预设模型对所述测试语料信息对的文字相似特征维度进行处理，得到第一测试分数，包括：将所述测试语料信息对输入第一预设模型中的每一棵树，输出多个分数值；根据所述多个分数值进行求和，得到第一测试分数；

将第一测试分数低于第一预设阈值的测试语料信息对输入第二预设模型进行语义相似特征维度处理，得到第二测试分数，包括：将所述第一测试分数低于第一预设阈值的测试语料信息对输入第二预设模型，使得第二预设模型将输入的测试语料信息对转化为向量信息进行特征处理，输出特征向量信息；将输出的特征向量信息连接全连接层分类器，得到第二测试分数；

将所述第二测试分数高于第二预设阈值的测试语料信息对输入数据库。

2.根据权利要求1所述的信息处理方法，其特征在于，所述第一预设模型为通过对样本语料对之间的文字相似特征维度与预设标签之间的非线性关系进行学习得到。

3.根据权利要求2所述的信息处理方法，其特征在于，所述第一预设模型为XGBoost树模型。

4.根据权利要求3所述的信息处理方法，其特征在于，所述信息处理方法，还包括：

获取样本语料对，所述样本语料对携带预设标签；

将所述样本语料对和预设标签输入初始XGBoost树模型中的第一棵树进行训练，得到第一分数值；

获取所述第一分数值与预设标签之间的第一残差值；

将所述第一残差值作为第二棵树的预设标签并进行迭代训练处理，直至每一课树训练完毕，得到训练后的XGBoost树模型。

5.根据权利要求1至4任一项所述的信息处理方法，其特征在于，所述第二预设模型为通过对样本语料对之间的语义相似特征维度与预设标签之间的非线性关系进行学习得到。

6.根据权利要求5所述的信息处理方法，其特征在于，所述第二预设模型为BERT模型。

7.根据权利要求6所述的信息处理方法，其特征在于，所述信息处理方法，还包括：

获取样本语料对，所述样本语料对携带预设标签；