[发明专利]一种自动提交内容的检测方法以及装置在审
申请号: | 201110206620.7 | 申请日: | 2011-07-22 |
公开(公告)号: | CN102890688A | 公开(公告)日: | 2013-01-23 |
发明(设计)人: | 贺海军;李润超;勇凤伟;李晶;高自光;郭奇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 提交 内容 检测 方法 以及 装置 | ||
技术领域
本发明属于信息安全领域,尤其涉及一种自动提交内容的检测方法以及装置。
背景技术
随着网络技术的发展,人们能够通过网络实现在线支付、在线问答等功能,但由于网络功能仍不够完善,因此当人们在享受网络带来的便利的同时仍需承担相应的风险,比如被程序自动提交的内容数据窃取了在线支付的密码,从程序自动提交的内容数据中获取了广告信息等。
以问答社区中的作弊用户为例,这些作弊用户通常针对指定分类下的问题,采用自动程序自动从本问答社区或其他问答社区搜索相关问题并提取答案,然后自动将这些答案内容数据提交为当前问题的回答,以提高自己在社区中的等级、经验等属性值,或者在自动提交的内容数据中夹杂广告信息以达到推广产品的目的。使用自动程序提交内容不仅严重破坏了问答社区的公平性,而且影响了问答社区的内容质量。
现有的自动提交内容检测方法主要是通过关键词检测的。该方法首先从当前提交内容数据中抽取若干个关键词(一般为1~3个),然后依次在百度知道和搜搜问问的搜索入口执行自动搜索,并解析出百度知道和搜搜问问的首页结果中的Top10结果,如果某个结果页面中的最佳回答或满意答案和当前提交内容的相似度大于或者等于给定阈值,则认为当前提交内容为机器自动提交的内容数据。如果当前提交的内容数据在所有问答社区的搜索结果中都没有找到足够相似的答案,则认为当前提交的内容数据不是程序自动提交的内容数据。该自动提交内容数据检测方法由于涉及关键词抽取、检索结果页面解析以及文本相似度计算,因此技术处理复杂且检测效率较低。
发明内容
本发明实施例提供了一种自动提交内容的检测方法,旨在解决现有的自动提交内容检测方法在检测提交的内容数据是否为采用程序自动提交时所导致的技术处理复杂且检测效率较低的问题。
本发明实施例是这样实现的,一种自动提交内容的检测方法,所述方法包括下述步骤:
获取用户在预设时间内提交的内容数据的属性,所述内容数据的属性包括所述内容数据的长度以及提交所述内容数据的时间;
根据所述内容数据的属性提取自动提交的关键特征,并将所述自动提交的关键特征与预设的阈值进行比较,检测用户提交的内容数据是否为自动提交内容。
本发明实施例的另一目的在于提供一种自动提交内容的检测装置,所述装置包括:
内容数据属性获取单元,用于获取用户在预设时间内提交的内容数据的属性,所述内容数据的属性包括所述内容数据的长度以及提交所述内容数据的时间;
自动提交检测单元,用于根据所述内容数据的属性提取自动提交的关键特征,并将所述自动提交的关键特征与预设的阈值进行比较,检测用户提交的内容数据是否为自动提交内容。
本发明实施例通过对单个用户在预设时间内所提交的内容数据进行分析,提取出内容数据自动提交的关键特征,根据该内容数据自动提交的特征检测提交的内容数据是否为程序自动提交,并输出检测结果。由于该检测方法在提取自动提交关键特征以及判断用户提交的内容数据是否为自动提交时都只针对单个用户提交的内容数据,无需抽取关键词、解析检索结果页面以及文本相似度计算等,因此计算处理简单且效率较高,此外,该检测方法的检测范围较广,能够检测出的内容数据可以为用户自定义且无法在问答社区的搜索入口中找到的内容数据。
附图说明
图1是本发明第一实施例提供的自动提交内容的检测方法的流程图;
图2是本发明第二实施例提供的自动提交内容的检测装置的结构示意图;
图3是本发明提供的检测装置的自动提交检测单元的第一实施例的结构图;
图4是本发明提供的检测装置的自动提交检测单元的第二实施例的结构图;
图5是本发明提供的检测装置的自动提交检测单元的第三实施例的结构图;
图6是本发明提供的检测装置的自动提交检测单元的第四实施例的结构图;
图7是本发明提供的检测装置的自动提交检测单元的第五实施例的结构图;
图8是本发明提供的检测装置的自动提交检测单元的第六实施例的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例以用户为分析对象,通过分析用户提交的内容数据来提取自动提交内容的关键特征,并根据该关键特征检测用户提交的内容数据是否为自动提交内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110206620.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种包括有双膨胀水箱的双循环冷却系统改进结构
- 下一篇:用于内燃机的冷却系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法