[发明专利]信息处理方法、装置、计算机设备及存储介质有效
申请号: | 201911120840.0 | 申请日: | 2019-11-15 |
公开(公告)号: | CN112749326B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 刘刚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/335 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种信息处理方法,其特征在于,所述方法包括:
获取待处理信息,确定所述待处理信息中的各类信息元素;
将每类信息元素分别进行向量化,得到各类信息元素的特征向量;
分别针对每类信息元素,获得该类信息元素的特征向量以及该类信息元素对应的目标特征向量之间的相似度,其中,该类信息元素对应的目标特征向量是根据该类目标信息元素获得的;
根据各类信息元素对应的相似度,获得所述待处理信息与目标信息之间的相似度,所述目标信息中包括各类目标信息元素;
根据所述待处理信息与目标信息之间的相似度确定所述待处理信息的处理结果。
2.根据权利要求1所述的方法,其特征在于,所述待处理信息中至少包括文本信息元素、图像信息元素以及视频信息元素中的一类或者多类,
所述每类信息元素分别进行向量化前,还包括:
确定所述待处理信息中的文本信息元素的字数不大于第一阈值,和/或所述图像信息元素的数量大于第二阈值,和/或所述视频信息元素的数量大于第三阈值。
3.根据权利要求2所述的方法,其特征在于,所述待处理信息中至少包括所述图像信息元素,所述将各类信息元素进行向量化前,还包括:
确定所述图像信息元素中存在任一图像信息元素的图像长度大于第四阈值;
所述将每类信息元素进行向量化,得到各类信息元素的特征向量,包括:
将图像长度大于第四阈值的图像信息元素拆分为多个子图像信息元素;
将各个子图像信息元素进行向量化,得到各个子图像信息元素的特征向量。
4.根据权利要求2所述的方法,其特征在于,所述待处理信息中至少包括所述视频信息元素,
所述将每类信息元素进行向量化,得到各类信息元素的特征向量,包括:
将每个视频信息元素中的设定视频帧进行向量化,得到所述设定视频帧的特征向量,将所述设定视频帧的特征向量作为所述视频信息元素的特征向量。
5.根据权利要求2所述的方法,其特征在于,所述待处理信息中至少包括文本信息元素,
所述将每类信息元素进行向量化前,还包括:
确定所述文本信息元素存在多种翻译格式;
所述将每类信息元素进行向量化,得到各类信息元素的特征向量,包括:
将存在多种翻译格式的文本信息元素翻译为同一翻译格式的文本信息元素;
将翻译后的文本信息元素进行向量化,得到文本信息元素的特征向量。
6.根据权利要求2所述的方法,其特征在于,所述处理结果为是否召回所述待处理信息;
所述将每类信息元素进行向量化,得到各类信息元素的特征向量,包括:
将所述文本信息元素输入至转换器Transformer的双向编码器表示BERT模型中进行向量化,得到所述文本信息元素的特征向量。
7.根据权利要求1~6任一所述的方法,其特征在于,所述处理结果为是否将所述待处理信息作为重复信息,所述将每类信息元素进行向量化,得到各类信息元素的特征向量,包括:
将每类信息元素输入至已训练的向量化网络中进行向量化,得到将各类信息元素的特征向量,其中所述已训练的向量化网络为孪生神经网络中的部分网络结构;
所述分别针对每类信息元素,获得该类信息元素的特征向量以及该类信息元素对应的目标特征向量之间的相似度,包括:
将该类信息元素的特征向量以及该类信息元素对应的目标特征向量输入至所述已训练的判重网络,将所述判重网络的输出结果作为该类信息元素的特征向量以及该类信息元素对应的目标特征向量之间的相似度,其中所述已训练的判重网络为所述孪生神经网络中的部分网络结构。
8.根据权利要求7所述的方法,其特征在于,所述已训练判重网络至少包括第一全连接层以及第二全连接层,所述已训练的判重网络至少是将归一化指数softmax函数作为损失函数进行训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911120840.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:设备布建系统及其方法
- 下一篇:波动图像动态存储平台