[发明专利]一种数据处理方法及装置有效
申请号: | 201510441030.0 | 申请日: | 2015-07-24 |
公开(公告)号: | CN104965929B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 张琦;刘锋 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京信远达知识产权代理事务所(普通合伙) 11304 | 代理人: | 魏晓波 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本发明的实施方式提供了一种数据处理方法。该方法包括:从数据源读取网页文件;在所述网页文件中进行查找以生成特定数据内容;对所述特定数据内容进行导出。通过先在网页文件中进行查找以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,所导出的内容即为处理后的数据内容,本发明的方法使得无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。此外,本发明的实施方式还提供了一种数据处理装置。
技术领域
本发明的实施方式涉及数据处理技术领域,更具体地,本发明的实施方式涉及一种数据处理方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网技术的普及,很多用户习惯于使用一些网络服务或网络空间来记录自己的生活、工作等情况,例如用户可以通过博客来记录日常生活。
同时,用户有将上传到网络的数据内容(例如文字、图像等)进行导出并编辑排版处理的需求,例如将博客内容集结成书。目前,现有技术中已经出现了一些将网络数据内容进行导出的方案,例如读取某一数据源的地址,将该数据源中保存的全部数据内容进行导出,之后可以采用人工方式对所导出的数据内容进行所需要的处理。
发明内容
但是,现有技术的数据处理方式,需要将数据源中的全部数据内容进行导出后,用户再根据实际需求人工对所导出的数据内容进行编辑、筛选、排版等处理,当用户仅需要数据内容中的特定部分,而数据内容的数量又非常多时,则需要花费大量的时间、人力来完成对数据内容的编辑等处理工作,例如,仅需要数据内容中的文字部分,则需要将大量导出的数据内容中的非文字部分进行删除,数据处理过程的速度及效率极为低下。
因此在现有技术中将网络数据进行导出后的数据处理过程,是非常令人烦恼的过程。
为此,非常需要一种改进的数据处理方案,以使提高数据处理的速度及效率。
在本上下文中,本发明的实施方式期望提供一种数据处理方法及装置。
在本发明实施方式的第一方面中,提供了一种数据处理方法,包括:从数据源读取网页文件;在所述网页文件中进行查找以生成特定数据内容;对所述特定数据内容进行导出。
在本发明实施方式的第二方面中,提供了一种数据处理装置,包括:读取单元,用于从数据源读取网页文件;生成单元,用于在所述网页文件中进行查找以生成特定数据内容;导出单元,用于对所述特定数据内容进行导出。
根据本发明实施方式的数据处理方法和装置,可以从数据源中读取网页文件,先在网页文件中进行查找以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,所导出的内容即为处理后的数据内容,而无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了本发明实施方式可以在其中实施的应用场景;
图2示意性地示出了根据本发明一实施方式的数据处理方法的流程图;
图3示意性地示出了根据本发明一实施方式的数据处理装置的结构图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510441030.0/2.html,转载请声明来源钻瓜专利网。