[发明专利]一种基于RPA机器人的商品展示页违禁词检查方法在审
申请号: | 202111162820.7 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113806114A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 代培 | 申请(专利权)人: | 杭州分叉智能科技有限公司 |
主分类号: | G06F9/54 | 分类号: | G06F9/54;G06F40/18;G06Q30/06;G06K9/32 |
代理公司: | 杭州万合知识产权代理事务所(特殊普通合伙) 33294 | 代理人: | 丁海华;万珠明 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rpa 机器人 商品 展示 违禁 检查 方法 | ||
1.一种基于RPA机器人的商品展示页违禁词检查方法,其特征在于:包括:
在RPA机器人中通过指令编排搭建RPA应用流程;
通过RPA应用流程在电商平台中对商品展示页违禁词检查,包括:
步骤S1、在RPA应用流程中配置违禁词格式,输入商品链接以及自定义商品违禁词;
步骤S2、去除商品链接以及自定义商品违禁词中的无效数据和重复数据,形成检查表格;
步骤S3、RPA应用流程遍历检查表格中的商品链接,依次打开到对应平台商品详情页,获取商品详情页文本信息,判断是否存在违禁词,存在则记录;并下载详情页图片,再利用OCR技术识别下载详情页图片上文本内容,若存在违禁词则记录;
步骤S4、根据商品详情页文本信息的记录和商品详情页图片上文本内容的记录形成检查结果。
2.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:步骤S1中,通过手动输入、复制粘贴或Excel批量导入进行输入商品链接以及自定义商品违禁词;
其中,所述手动输入是通过则双击表格单元,在表格单元出现输入光标后,输入对应的备注信息;
所述复制粘贴是通过在选中的单元格中粘贴所复制的内容或通过选择复制Excel内容进行粘贴,
所述Excel批量导入是通过弹出文件选择对话框,选择指定导入的Excel文件,并选择要导入的Sheet页,设置是否需要将第一行内容作为表头。
3.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:步骤S2中,去除自定义违禁词和商品链接中的无效数据和重复数据,形成检查表格的过程具体是,
步骤S2.1、将电商平台的默认违禁词和自定义商品违禁词合并,去除重复的违禁词,形成违禁词变量;
步骤S2.2、读取用户输入的商品链接,去除重复的商品链接和为空的商品链接,形成商品链接数据;
步骤S2.3、将商品链接数据和违禁词变量写入数据表格,形成检查表格。
4.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:所述步骤S3的具体过程如下:
步骤S3.1、对检查表格进行行循环,从第一行循环遍历到最后一行;
步骤S3.2、循环遍历到一行数据,获取该行商品链接数据;
步骤S3.3、根据循环到的商品链接依次打开平台商品详情页,若检测到打开网页失败,记录失败原因,忽略本次循环,进行下一次循环;否则执行步骤S3.4;
步骤S3.4、获取商品详情页文本信息,并下载商品链接详情页的图片到本地;
步骤S3.5、循环商品详情页文本信息中是否存在违禁词,若存在则记录;
步骤S3.6、获取下载图片的尺寸大小;若图片高度大于2000dpi,则横向切割图片,将图片等比切割,生成图片列表,再执行步骤3.7;否则直接执行步骤3.7;
步骤S3.7、依次通过OCR技术识别图片文本内容;
步骤S3.8、基于步骤S3.7识别到的文本,循环检查图片文本内容本中是否存在违禁词,若存在则记录。
5.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:所述指令编排包括指令添加,指令编辑和指令折叠;
所述指令添加是将指令集列表中的指令添加到RPA机器人的流程设计器中;
所述指令编辑是对添加到流程设计器中的指令进行编辑;
所述指令折叠是将流程设计器中指定位置和数量的指令进行折叠,并添加注释,提高流程指令的管理效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州分叉智能科技有限公司,未经杭州分叉智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111162820.7/1.html,转载请声明来源钻瓜专利网。