[发明专利]对象类别的分析方法及装置有效
| 申请号: | 202010304997.5 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111461904B | 公开(公告)日: | 2022-06-21 |
| 发明(设计)人: | 曹绍升;陈超超;吴郑伟 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06F16/35 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 姚琳洁;朱文杰 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对象 类别 分析 方法 装置 | ||
本说明书一个或多个实施例公开了对象类别的分析方法及装置,用于解决现有技术中对象类别的分析准确度较低的问题。所述方法包括:获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。
技术领域
本说明书涉及文本处理及神经网络技术领域,尤其涉及一种对象类别的分析方法及装置。
背景技术
在一些场景中,需要检测出满足一定条件的目标类别的对象。通常,在检测一个对象是否为目标类别的对象时,可以将该对象与一个目标类别的对象进行比对,如果两者相似度较高,即可判定该对象属于目标类别,因此准确地计算对象相似度显得非常关键。但是,现有的确定对象相似度的方法准确性较低,导致对象类别的分析结果也相对不够准确。
以保险服务场景为例。针对保险服务,通常通过常规的地理位置、账号注册设备等信息分析可识别出目标团伙。但是,这些常规的识别方法很容易被反针对绕过,从而导致无法很好地抓取更多的团伙成员。
发明内容
一方面,本说明书一个或多个实施例提供一种对象类别的分析方法,包括:获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。
另一方面,本说明书一个或多个实施例提供一种理赔行为的分析方法,包括:获取非法理赔行为对应的第一保险理赔文本,及,获取待检测对象对应的第二保险理赔文本。利用预先训练的序列到序列模型及词向量集,确定所述第一保险理赔文本对应的第一文本向量及所述第二保险理赔文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本保险理赔文本训练得到,各所述样本保险理赔文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一保险理赔文本及所述第二保险理赔文本之间的相关性信息。根据所述第一保险理赔文本及所述第二保险理赔文本之间的相关性信息,确定所述待检测对象是否属于所述非法理赔行为。
再一方面,本说明书一个或多个实施例提供一种对象类别的分析装置,包括:第一获取模块,获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。第一确定模块,利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。第二确定模块,基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。第三确定模块,根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010304997.5/2.html,转载请声明来源钻瓜专利网。





