[发明专利]网页文本的修改方法及装置有效
申请号: | 201610339809.6 | 申请日: | 2016-05-20 |
公开(公告)号: | CN107402930B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 王超 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 文本 修改 方法 装置 | ||
1.一种网页文本的修改方法,其特征在于,该方法包括:
接收针对当前网页文本的修改请求;所述修改请求至少指示出待修改属性;
获取所述当前网页文本以及所述当前网页文本对应的网页模板;所述当前网页文本和所述网页模板包含相同的格式信息;所述格式信息为html标签;
所述当前网页文本还包含数据信息,所述网页模板 还包含对应于所述数据信息的占位信息;所述占位信息至少指示出所述当前网页文本所包含属性的属性名;所述数据信息至少指示出对应于所述属性名的属性值;
从所述网页模板中剔除所述占位信息,将所述网页模板中除所述占位信息外的其它信息作为所述格式信息;
根据所述格式信息,从所述当前网页文本中提取所述数据信息;
根据所述修改请求,修改所述数据信息中对应于所述待修改属性的属性名的属性值;
用修改后的所述数据信息中对应于各属性名的属性值,替换所述网页模板中包含对应属性名的占位信息,得到修改后的网页文本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述格式信息,从所述当前网页文本中提取数据信息,具体为:
从所述当前网页文本中剔除所述格式信息;
将所述当前网页文本中剔除所述格式信息之后的剩余信息作为所述数据信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述占位信息中提取名称信息;
将提取的所述名称信息作为属性名,将所述数据信息作为属性值,生成数据对象;
保存所述数据对象。
4.一种网页文本的修改装置,其特征在于,该装置包括:
接收单元,用于接收针对当前网页文本的修改请求;所述修改请求至少指示出待修改属性;
获取单元,用于获取所述当前网页文本以及所述当前网页文本对应的网页模板;所述当前网页文本和所述网页模板包含相同的格式信息;所述格式信息为html标签;
所述当前网页文本还包含数据信息,所述网页模板 还包含对应于所述数据信息的占位信息;所述占位信息至少指示出所述当前网页文本所包含属性的属性名;所述数据信息至少指示出对应于所述属性名的属性值;
解析单元,用于从所述获取单元获取的所述网页模板中剔除所述占位信息,将所述网页模板中除所述占位信息外的其它信息作为所述格式信息;
提取单元,用于根据所述格式信息,从所述获取单元获取的所述当前网页文本中提取所述数据信息;
修改单元,用于根据所述修改请求,修改所述提取单元提取的所述数据信息中对应于所述待修改属性的属性名的属性值;
生成单元,用于用所述修改单元修改后的所述数据信息中对应于各属性名的属性值,替换所述网页模板中包含对应属性名的占位信息,得到修改后的网页文本。
5.根据权利要求4所述的装置,其特征在于,所述提取单元具体用于:
从所述当前网页文本中剔除所述格式信息;
将所述当前网页文本中剔除所述格式信息之后的剩余信息作为所述数据信息。
6.根据权利要求4所述的装置,其特征在于,所述装置还包括:保存单元;
所述提取单元,还用于从所述占位信息中提取名称信息;
所述生成单元,还用于将所述提取单元提取的所述名称信息作为属性名,将所述数据信息作为属性值,生成数据对象;
所述保存单元,用于保存所述生成单元生成的所述数据对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610339809.6/1.html,转载请声明来源钻瓜专利网。