[发明专利]基于电子邮件地址和其他帐户信息的用户帐户的基于机器学习的分类有效
| 申请号: | 201380005288.5 | 申请日: | 2013-01-09 |
| 公开(公告)号: | CN104054103A | 公开(公告)日: | 2014-09-17 |
| 发明(设计)人: | B·B·朱;F·薛 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q50/32 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 电子邮件地址 其他 帐户 信息 用户 机器 学习 分类 | ||
背景
在线交易通常需要在线帐户。每一个在线帐户都包含与帐户的用户有关的信息,诸如电子邮件地址、姓名、家庭地址、电话号码等。为了避免被抓住并提高成功率,恶意用户通常在短时间内将一帐户用于非法用途并且然后切换至另一帐户,由此需要大量帐户。用于非法交易的帐户可能是其它合法用户的受损害的帐户或者可由恶意用户创建。可使用自动化程序(即,机器人程序)来生成大量电子邮件地址以注册这样的欺诈性帐户。例如,这些欺诈性帐户可以与某些被盗的或非法信用卡相关联以便在线进行欺诈性交易。诸如相关联的电子邮件地址等与帐户相关联的信息被手动查阅以标识恶意帐户,这是昂贵、劳动密集且耗时的。
概述
提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。例如,术语“技术”可以指上述上下文和本公开通篇所准许的设备、系统、方法、和/或计算机可读指令。
本发明提供了至少部分地基于包括电子邮件地址在内的信息和/或与传入帐户相关联的其他附加信息来标识该帐户是否是恶意的技术。这些技术从与帐户相关联的信息中提取特征,并应用分类模型以基于所提取的特征来生成指示传入帐户有多少可能是恶意的分数。这一分数可以至少部分地由电子邮件地址的可记性程度来确定。可记性指的是一个人记住电子邮件地址的容易度。可记性程度可通过使用将人类生成的电子邮件地址与机器生成的电子邮件地址区分开的一个或多个特征来确定以生成电子邮件地址的可记性程度。另外,分数还可部分地由电子邮件地址的域来确定,并且可基于与帐户相关的其他附加信息,诸如电子邮件地址与诸如姓名、电话和地址等其他帐户信息的相关性,以帮助确定该帐户是否是恶意的。例如,该分数还可部分地由除了与帐户相关联的电子邮件地址之外的信息来确定,诸如帐户名称、地址等是否匹配信用卡的对应信息、地址的有效性、帐户已经创建多久,等等。
本发明的技术应用机器学习来学习从训练数据中提取的将恶意帐户与良性帐户区分开的一个或多个特征,基于这些特征获取分类模型,并且使用该分类模型自动确定指示传入帐户有多少可能是恶意的分数。分类模型可以用新数据来持续改进并进行增量式训练。例如,可以从一个或多个在线交易的结果获取的指示传入帐户是恶意的还是良性的该传入帐户的地面真值(ground truth)可用于训练分类模型以相应地调整分类模型。例如,传入帐户的地面真值可以与由分类模型确定的结果进行比较并且这一比较结果用于改进分类模型。
附图简述
参考附图来描述具体实施方式。在附图中,附图标记中最左边的数字标识该附图标记首次出现的附图。在各附图中,使用相同的标号来指示相同的特征和组件。
图1示出了基于帐户的电子邮件地址和其他附加信息来确定该帐户的分数的示例场景。
图2示出了用于确定帐户的分数的示例方法的流程图。
图3示出了用于机器学习以标识特征和生成分类模型的示例方法的流程图。
图4示出了用于持续训练分类模型的示例方法的流程图。
详细描述
本发明技术至少部分地基于电子邮件地址的可记性程度来确定与电子邮件地址和其他附加信息相关联的帐户的分数。该分数确定该帐户有多少可能是恶意的或良性的。另外,这些技术还可使用与帐户和/或电子邮件地址相关联的其他特征,诸如电子邮件地址的域、与帐户和/或电子邮件地址相关联的电话号码和用户名的相关性、或与帐户相关联的其他特征,来确定该帐户的分数。
与良性帐户相关联的电子邮件地址通常是人类生成的,而与恶意帐户相关联的电子邮件地址通常可能是机器生成的。人类生成的电子邮件地址通常是为了在一段时间内容易记住而选择的。通常存在特定特征来帮助记忆,诸如有意义的串和数字、可发音的串、人类生成的电子邮件地址中的对称性。它们的长度通常也是短的。当前机器生成的电子邮件地址通常缺少这些特征。在一些实施例中,一些电子邮件地址可通过可记性测试并且被认为是人类生成的,但在这些电子邮件地址的域或与电子邮件地址和/或帐户相关联的其他附加信息被确定为与恶意帐户相关联的情况下仍旧可被认为是与恶意帐户相关联的。在其他实施例中,除电子邮件地址之外的帐户数据,诸如与帐户相关联的姓名及其与在线交易中所使用的信用卡的姓名的相关性、与帐户相关联的地址的有效性等,也可用于确定帐户是恶意的可能性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380005288.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于测定羽毛绒浊度的浊度校准液
- 下一篇:一种Cuk型开关电源的控制系统





