[发明专利]用于检测欺诈性文本消息的设备和相关方法有效
申请号: | 200980131791.9 | 申请日: | 2009-08-04 |
公开(公告)号: | CN102124485A | 公开(公告)日: | 2011-07-13 |
发明(设计)人: | C·W·维克;M·里索夫 | 申请(专利权)人: | 惠普开发有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李娜;王洪斌 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 欺诈 文本 消息 设备 相关 方法 | ||
技术领域
本发明一般涉及一种方式,通过该方式来检测接收的电子邮件或其他文本消息是垃圾或其他欺诈性消息。更具体而言,本发明涉及一种设备和相关方法,通过该设备和相关方法,通过针对非母语说话者(non-native language speaker)使用的文本所特有的文本对消息进行分析来确定该消息是否是欺诈性的。
包括非母语说话者通常所犯的语法和使用错误的列表的规则集被访问且用于分析接收消息的文本。如果接收消息被确定为很可能由非母语说话者所写且具有指示欺诈性消息的其他特性,则该消息被认为很可能是欺诈性消息。
背景技术
通信技术的进步已经允许新类型的通信服务的开发、部署和常规使用。对于很多人而言,能够使用这些通信服务来进行通信是他们日常生活的不可或缺的部分,无论是用于业务通信还是用于个人通信。
例如,常常通过使用诸如可连接到通信网络的计算机站的基于处理器的装置来实施通信。常规的个人计算机可连接到私有网络和公共网络,例如互联网。一旦连接,在计算机站发源的通信数据能够被传送到其他地点,诸如传送到另一类似连接的计算机站。到通信网络的连接通过有线连接或无线连接以各种方式进行。例如,无线连接通过各种蜂窝通信系统、基于WiFi的通信、基于IEEE 802.11的通信等的任意一种中定义的任何无线电空中接口。
诸如电子邮件消息的文本消息常常通过通信网络在计算机或其他通信站之间传送。电子邮件服务有时被称为存储转发服务,因为为了实施创建的消息的发送和接收,消息的发源者和消息的接收者不需要同时可用。而是,一旦创建,消息被路由到邮件服务服务器或其他装置,以在接收者可用于接收消息时将其递送给接收者。邮件服务器或类似装置存储消息,直到接收者可用为止,且当接收者可用时,消息被转发给接收者。
一般地,消息包括消息的发源者的识别、消息的预期接收者的识别、包括主题行的消息主体且有时包括附件。
典型地,消息的发送者和接收者不需要付费。而是,消息的发送和接收一般包括在对网络连接收费的服务预订或者周期访问中。
消息的发送的通常免费的性质有时导致这种通信服务的滥用。如使用邮件服务发送或接收消息的几乎任何人所意识到的,很多消息由未知发送者发送,经常恳求出售接收者不想要的产品或服务,并且经常是令人讨厌的。这些消息有时被称为垃圾消息。并且,一些消息试图引诱接收者购买决不会被运送的物品,或者提供使得接收者被欺诈的金融信息。所有这些消息在此处有时被称为欺诈性消息。很多时候,这些欺诈性消息源于远离接收者所处的管辖区域的位置。
不幸的是,大量垃圾消息被传送。一些人估计,垃圾消息的数目明显超过了通过公共网络传送的合法消息的数目。如很多人所知道的,在打开接收者的邮件客户端或者应用时,在接收者的收件箱接收的垃圾消息数目常包括这种垃圾或其他欺诈性消息。为了减小寄至接收者的邮件客户端或应用的接收者的收件箱的欺诈性消息的数目,开发了过滤器来过滤这种消息。当过滤器检测到欺诈性消息时,消息被删除或路由到不同于接收者收件箱的文件夹。也就是说,过滤器的操作过滤了欺诈性消息,使得接收者的收件箱文件夹不会被不想要的消息充斥 。
垃圾过滤器以各种方式工作以区分合法消息和欺诈性即垃圾消息。有时利用关键词或字符串识别。概念识别、用户限定的基于规则的过滤、发源者的身份的分析、消息内容的统计分析以及与类似消息的过滤器数据库的比较有时都被使用。
然而,尽管做出了最大的努力,现有的过滤器经常过滤合法消息或者不能过滤欺诈性消息。接收的消息的过度过滤和不充分过滤都是有问题的。
如果能够提供一种改进的方式,通过该方式来更好地过滤接收的消息,则将减轻与过度过滤和不充分过滤相关的问题。
正是鉴于与传送消息相关的这种背景信息而发展了本发明的显著改进。
发明内容
因此,本发明有利地提供一种设备和相关方法,通过该设备和相关方法来检测接收的电子邮件或其他文本消息是垃圾或其他欺诈性消息。
通过本发明的实施例的操作,提供一种方式,通过该方式,通过结合欺诈分析的常规方法(即,关键词或内容分析),针对非母语说话者键入的文本特有的文本部分对消息进行分析,来确定该消息是否是欺诈性的。
在本发明的一个方面中,包括非母语说话者常犯的语法和使用错误的列表的规则集被访问且用于分析接收的消息。如果包含潜在欺诈性内容的接收消息被确定为很可能由非母语说话者所写,则指示较高的欺诈概率。通过考虑包括语法错误和使用模式的句法模式,提供对接收消息的改善过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普开发有限公司,未经惠普开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980131791.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:消息路由平台
- 下一篇:风力发电用蓄电池控制系统及其控制方法