[发明专利]安卓应用程序中非权限相关隐私数据的识别方法有效
| 申请号: | 201510374683.1 | 申请日: | 2015-07-01 | 
| 公开(公告)号: | CN104966031B | 公开(公告)日: | 2018-02-27 | 
| 发明(设计)人: | 杨珉;杨哲慜;南雨宏;周顺帆;张源 | 申请(专利权)人: | 复旦大学 | 
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/30;G06F17/27 | 
| 代理公司: | 上海正旦专利代理有限公司31200 | 代理人: | 陆飞,盛志范 | 
| 地址: | 200433 *** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 应用程序 中非 权限 相关 隐私 数据 识别 方法 | ||
技术领域
本发明属于程序信息安全检测技术领域,具体涉及利用自然语言处理、机器学习技术和静态信息流分析技术,识别Android应用程序中非权限相关的隐私数据的方法。
背景技术
谈及Android系统中的用户隐私信息,大致可分为两类,第一类为权限相关的用户隐私,第二类为非权限相关的用户隐私。其中,权限相关的用户隐私指的是通过调用Android系统权限模型提供的函数接口所能获得的用户隐私信息,如通过调用getIMEI()函数获取手机序列号、调用getLocation()函数获取用户地理位置信息等。由于安卓自身通过权限保护机制来管控这样的隐私数据, 在调用此类函数获取隐私信息之前必须声明相应的权限,故称此类隐私信息为权限相关的隐私信息。
相对而言,非权限相关的用户隐私涉及范围更广,监控难度更大。此类隐私并非应用通过调用系统函数获得,而是通过直接与用户交互获取。如用户在使用购物类应用时所输入的网银账号信息,或是其他用户名、密码等信息,都属于非权限相关的用户隐私范畴。应用在获取到此类信息之后,可能将其以文件形式进行持久化存储或通过网络向服务器发送以实现特定功能。
对于权限相关的隐私数据,由于其敏感数据源固定(如上述getIMEI()、getLocation()等函数),故可通过传统的静态信息流分析,对数据进行追踪和监控;而对于非权限相关的隐私数据而言,敏感数据源将随着具体应用程序的不同而不同,敏感数据与普通数据混杂在用户界面当中,因为它们均为用户使用应用所产生的数据。故从程序分析的角度, 无法通过信息流分析、污点跟踪技术等对其进行有效的检测分析。
发明内容
本发明的目的是提供一种支持大规模批量、离线分析的,Android应用程序中非权限相关隐私数据的自动识别方法。
本发明提供的Android应用程序中非权限相关的隐私数据的识别方法,具有以下特点:
(1)仅凭借对代码的静态分析识别敏感数据源,无需额外的用户交互信息;
(2)具备自适应能力,分析应用的速度快、资源消耗低;
(3)以界面元素为依据对用户隐私进行识别,并自动判定界面元素与后台函数的关系.
由于非权限相关的用户隐私数据涉及范围较广,且不同类别的用户隐私涉及的文本词汇都有较大差异,为了便于解释说明,本发明将用户隐私数据总结为三类:
(1)Account Credentials and User Profiles(账户相关的认证信息以及用户数据);
(2)Location(地理位置数据);
(3)Financial(金融支付类隐私数据)。
对于不同类别的隐私数据,本发明所关注的文本特征略有差别。
本发明提供的Android应用程序中非权限相关的隐私数据的识别方法,其架构如附图1所示,整个识别过程分为四个阶段:
1、数据预处理,包括:提取资源文件,文本预处理。
提取资源文件:首先对Android应用程序进行逆向工程,提取得到描述界面的资源文件。在Android应用程序中,用户交互界面(UI)是由若干个界面元素所组成的,不同种类的界面元素提供了展示信息、接受输入等不同功能。Android系统主要使用XML文件来描述用户交互界面。
对于逆向后的Android应用程序,其描述界面的XML文件散布于不同的文件夹中。其中,用以描述UI界面的布局文件位于res/layout文件夹下;界面元素和其16进制ID的对应关系存储于res/value/public.xml文件中;界面中所展示的文本(即界面文本)位于/res/values/strings.xml文件中。上述资源文件的内容如附图2的样例所示。
由于本发明分析的重点在于应用的界面元素,所以本发明关注的信息主要有两类:界面文本和布局信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510374683.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于获取图像数据的条码识读引擎
- 下一篇:数据保护系统、方法和装置





