[发明专利]一种实现门户网站移动化展现的自动化方法和系统在审
申请号: | 202010226437.2 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111125606A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 金震宇;朱浪 | 申请(专利权)人: | 大汉软件股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 刘林 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 门户 网站 移动 展现 自动化 方法 系统 | ||
本发明公开了一种实现门户网站移动化展现的自动化方法和系统,属于门户网站技术领域,包括以下步骤:通过httpClient模拟浏览器访问,采集信息并以xml的格式临时保存;对采集过的信息进行标记;轮询的解析线程自动读取临时文件目录中的xml文件,同时转换为统一的数据格式;将清洗完成后的信息保存在云端服务器上,并清空临时文件;在信息转换系统上创建同步任务,并关联数据转换模板,数据转换模板能够自定义每个字段中任意标签的样式。本发明通过提供导出、导入数据模板功能,能够自动识别模板中的标签样式,数据模板中标签和样式可以自定义,为移动端的页面提供了高度统一的样式风格。
技术领域
本发明涉及一种自动化方法和系统,特别是涉及一种实现门户网站移动化展现的自动化方法和系统,属于门户网站技术领域。
背景技术
虽然互联网技术早已跃升到移动时代,但因为种种原因,许多大型政府企业的门户系统,仍旧是基于异构的老旧系统开发维护的,对外既没有内容的输出API,也没有数据库直接读取的权限,传统的信息门户没有办法做到移动化的自动转化,需要分别维护门户和移动端的频道和信息,导致维护较多内容重复,浪费资源。
现有技术的缺陷和不足:(1)PC和移动端单独维护,维护成本高;(2)目前对门户网站信息的提取,无法满足移动端展示的规范,往往保留了门户系统中的页面样式风格,在移动端的排版、间距、格式无法达到高度统一;(3)无法根据需要自定义移动端的样式,根据不同的门户网站创建不同的样式模板。
发明内容
本发明的主要目的是为了解决现有技术的不足而提供一种具有高度统一的样式风格和导入数据模板功能的实现门户网站移动化展现的自动化方法和系统。
本发明的目的可以通过采用如下技术方案达到:
一种实现门户网站移动化展现的自动化方法,包括以下步骤:
步骤1:通过httpClient模拟浏览器访问,采集信息并以xml的格式临时保存;
步骤2:对采集过的信息进行标记;
步骤3:轮询的解析线程自动读取临时文件目录中的xml文件,同时转为为统一的数据格式;
步骤4:将清洗完成后的信息保存在云端服务器上,并清空临时文件;
步骤5:在信息转换系统上创建同步任务,并关联数据转换模板,数据转换模板能够自定义每个字段中任意标签的样式;
步骤6:启动信息转换系统上的同步任务,将采集信息同步到信息转换系统上;
步骤7:信息转换系统解析同步过去的xml文件并为每个字段添加自定义的样式,并生成新的xml文件;
步骤8:信息转换系统将信息同步给移动端,移动端在接收到信息后展示。
在步骤1中,通过httpClient模拟浏览器访问,采集门户网站内容页面信息,按前后标识提取对应字段的信息,并将采集信息以xml的格式保存在云端服务器的临时文件目录中。
在步骤2中,将采集过的信息缓存在列表中并根据信息的内容页地址进行标记。
在步骤3中,轮询的解析线程会自动从云端服务器的临时文件目录中读取xml文件,将每个采集项字段转换成DOM树,并清空DOM树上的每个node节点的样式属性,同时统一数据的格式。
信息转换系统能够自定义数据模板,设置标题、链接、发布时间、来源、内容各自对应相关标签的字体、大小以及行间距。
采集信息划分为标题、链接、发布时间、来源和内容五个字段。
一种实现门户网站移动化展现的自动化系统,包括:
信息采集系统,采集门户网站的信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大汉软件股份有限公司,未经大汉软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010226437.2/2.html,转载请声明来源钻瓜专利网。