[发明专利]一种移动应用数据处理方法在审
申请号: | 201810741622.8 | 申请日: | 2018-07-09 |
公开(公告)号: | CN109145186A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 邓春林;王再超;谢言 | 申请(专利权)人: | 湖北中医药大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F17/27;G06Q30/02 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 杨本官 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动应用 评论数据 数据处理 收集处理 无效数据 有效处理 语法特点 数据量 中文 存储 压缩 应用 分析 | ||
本发明属于移动应用领域,尤其涉及一种移动应用数据处理方法。本发明的一种移动应用数据处理方法,能够有效处理数据量庞大的评论数据,压缩无效数据,合理且迅速的甄别对移动应用的评价以及分析有用的数据并进行相应处理,本发明充分结合中文的语法特点,针对性地对评论数据进行处理和存储,能够大大加快中文评论数据的收集处理速度,该方法再现方便,工具简单,具有良好的应用前景。
技术领域
本发明属于移动应用领域,尤其涉及一种移动应用数据处理方法。
背景技术
随着移动应用的快速发展,各类移动APP日益成为人们日常生活中不可或缺的工具,与传统实体工具不同,移动APP的后台服务以及具体操作是不可见的,用户也不能或者仅能在很小的自由度下对自己的需求进行主动获取和分析,这些工作通常是由移动应用后台服务上经过数据获取和分析后主动向使用者进行推送或者利用更新等方式进行改变,这种方式使得用户不需要对移动应用的具体流程以及内部复杂的控制机理进行了解即可被动的获取相应信息或数据,但同时,这种被动的获取方式使得用户在使用移动应用过程中发现或者遇到问题、或者使用异常时不能主动进行改变,也缺乏有效途径能够将上述信息主动直接传递至用途有决策权的管理者层面,在此背景下,随着移动应用的推广而产生的用户体验数据就显得尤为重要,在各类用户体验数据中,由用户直接发表和陈述在接入端(主要是指各应用商场、论坛等信息收集环境)网页上的用户评论具有最直接的参考性。对于一个长期稳定发展并期望获得更多使用者得移动应用而言,收集用户评论,用来评价移动应用的使用效果,分析移动应用的优缺点,并进行针对性改进是一个必要的工作,但由于用户评论的数量庞大,且由于市场竞争以及大量用户无意识的行为,导致有效收集和分析用户评论难以进行。
发明内容
本发明创造的目的在于,提供一种移动应用数据处理方法,以能够快速有效的实现对移动应用评论数据的甄选筛查,以便于提取有效的关键数据为移动应用的评价分析提供依据。
为实现上述目的,本发明创造采用如下技术方案。
一种移动应用数据处理方法,包括如下内容,
一、用于获取移动应用相关数据的步骤,包括获取软件标志数据,所述软件标志数据包括软件名称、软件分类以及软件简介;
二、用于从用户评论数据中获取评论相关的元素数据的步骤,所述元素数据包括用户评论、软件版本、评论端口、评论时间、用户ID;具体包括如下步骤:
步骤1、接入评论端口,获取网页数据,搜索需要抓取数据的移动应用的标志数据,对标志数据相应的网页进行抓取;在抓取数据时需要对网页的加载方式进行判断,并根据不同加载方式使用不同的分析方法抓取数据,具体是指采用Jsoup分析静态加载方式的网页标签数据,采用HttpUnit抓取动态加载方式的网页标签数据;
步骤2、判断该网页数据是否含有的标志数据相应的移动应用;若有抓取各网页并存入相应数据库;所述数据库是根据各移动应用作为分类因素分别建立的与各移动应用相应的数据库;
步骤3、判断是否还有后续网页,若有则跳转至步骤二,若无则跳转至步骤4;
步骤4、将所有以抓取的网页转换为文本格式,定位和获取评论数据相对应的元素数据;所述定位和获取评论数据相对应的元素数据具体包括,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北中医药大学,未经湖北中医药大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810741622.8/2.html,转载请声明来源钻瓜专利网。