[发明专利]恶意订单识别方法及装置有效
| 申请号: | 201510808956.9 | 申请日: | 2015-11-20 |
| 公开(公告)号: | CN105389722B | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | 于亮;马利超;韩爱君 | 申请(专利权)人: | 小米科技有限责任公司 |
| 主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
| 代理公司: | 11138 北京三高永信知识产权代理有限责任公司 | 代理人: | 滕一斌 |
| 地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 恶意 订单 识别 方法 装置 | ||
1.一种恶意订单识别方法,其特征在于,应用于购物平台所对应的服务器,所述方法包括:
去除待识别地址中的停用词;
根据预设的第一分词算法,对所述待识别地址进行分词,得到所述待识别地址中的待识别词语;
统计所述待识别词语中,属于恶意词语库中的词语的个数,所述恶意词语库为预先建立的,所述恶意词语库记录有至少一个用于标识恶意地址的恶意词语;
根据所述属于所述恶意词语库中的词语的个数,判断所述待识别地址是否为恶意地址;
当所述待识别地址为恶意地址时,确定所述待识别地址对应的订单为恶意订单;
对所述恶意订单对应的恶意用户执行预设操作,所述预设操作为注销所述恶意用户的账号或者取消所述恶意用户的订单;
所述方法还包括:
获取待识别词语集合;
对于所述待识别词语集合中的任一词语,根据词语恶意度评分公式计算所述任一词语的恶意度评分S2,所述词语恶意度评分公式为:
其中,abs()表示对括号中内容取绝对值,k1为预设的共性常数,k2为预设的长度特征值,tf为所述任一词语在数据库中的词频,df为所述任一词语在所述数据库中的文档频率,L为所述数据库中含有所述任一词语的地址中包含字符数不同的地址的个数,所述预设的共性常数和所述预设的长度特征值是根据标注的语料库以及所述词语恶意度评分公式,通过机器学习的方式训练得到的;
判断所述任一词语的恶意度评分S2是否小于预设的评价阈值k3,所述预设的评价阈值k3根据标注的语料库以及所述词语恶意度评分公式,通过机器学习的方式训练得到;
当所述任一词语的恶意度评分S2小于预设的评价阈值k3时,确定所述任一词语为恶意词语;
根据所述待识别词语集合中的恶意词语,建立所述恶意词语库;
所述获取待识别词语集合,包括:
根据预设的第二分词算法,对所述数据库中的每个地址进行分词;
将分词后的词语组成所述待识别词语集合。
2.根据权利要求1所述的方法,其特征在于,所述根据所述属于所述恶意词语库中的词语的个数,判断所述待识别地址是否为恶意地址,包括:
统计所述待识别地址中的待识别词语的个数n;
根据所述属于所述恶意词语库中的词语的个数m及所述待识别地址中的待识别词语的个数n,通过地址恶意度评分公式计算所述待识别地址的恶意度评分S1,所述地址恶意度评分公式为:S1=m/n;
判断所述待识别地址的恶意度评分S1是否大于预设阈值t,所述预设阈值t是根据所述数据库中的地址预先设定的;
当所述恶意度评分S1大于预设阈值t时,确定所述待识别地址为恶意地址;
当所述恶意度评分S1不大于预设阈值t时,确定所述待识别地址不为恶意地址。
3.根据权利要求1所述的方法,其特征在于,所述第二分词算法包括所述第一分词算法,所述第二分词算法包括二字切分算法和三字切分算法中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510808956.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:含沥青组合物的再生方法
- 下一篇:数字滤波器





