[发明专利]数据处理方法、文本显示方法、数据处理系统及设备在审
| 申请号: | 202211460790.2 | 申请日: | 2022-11-21 |
| 公开(公告)号: | CN115828862A | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 鲁志红;赵帅帅;刘敏 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/33;G06F16/35;G06F16/383;G06F3/0484;G06Q30/0601 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 柴艳波 |
| 地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 文本 显示 数据处理系统 设备 | ||
1.一种数据处理方法,其特征在于,适于服务端,所述方法包括:
从多个数据源,获取目标商品关联的多媒体数据;
对所述多媒体数据进行处理,得到多个文本信息;
基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目;
对所述多个文本信息按类目进行文本编辑,得到所述目标商品的结构化描述文本。
2.根据权利要求1所述的方法,其特征在于,对所述多媒体数据进行处理,得到多个文本信息,包括:
对所述多媒体数据进行文本化处理,得到至少一个文本信息;
基于所述多媒体数据,在商品卖点文案库中查询与所述目标商品适配的至少一个文本信息。
3.根据权利要求2所述的方法,其特征在于,所述多媒体数据包括所述目标商品的属性信息,所述属性信息包括商品标题、商品类别及商品属性数据;
以及
基于所述多媒体数据,在商品卖点文案库中查询与所述目标商品适配的至少一个文本信息,包括如下中的至少一项:
利用深度语义匹配模型,从所述商品卖点库中召回与所述属性信息匹配的至少一个第一卖点文案;
从所述商品卖点库中,召回与所述目标商品的商品类别相对应的至少一个第二卖点文案;
根据所述至少一个第一卖点文案和所述至少一个第二卖点文案,确定与所述目标商品卖点相关的至少一个文本信息。
4.根据权利要求2所述的方法,其特征在于,所述多媒体数据包括如下中的至少一项:所述目标商品的主图片、所述目标商品的第一商品详情信息、所述目标商品相关的第一音频信息、所述目标商品相关的第一视频信息、与所述目标商品同款商品的第二商品详情信息、与所述目标商品同款商品的第二音频信息、与所述目标商品同款商品的第二视频信息;
其中,商品详情信息包括详情图片和/或详情文本;
以及
对所述多媒体数据进行文本化处理,得到至少一个文本信息,包括如下中的至少一项:
利用图片描述技术,对所述主图片进行识别,生成描述所述主图片的文本信息;
对所述第一音频信息和/或所述第二音频信息进行语音识别,基于语音识别结果生成与所述目标商品相关的文本信息;
对所述第一商品详情信息和/或所述第二商品详情信息中的详情图片进行文字识别,根据文字识别结果生成文本信息;
基于所述第一商品详情信息和/或所述第二商品详情信息中的详情文本,获得至少一个文本信息;
对所述第一视频信息和/或第二视频信息中抽取关键帧,对所述关键帧进行图像识别,根据图像识别结果生成与所述目标商品相关的文本信息。
5.根据权利要求1至4中任一项所述的方法,其特征在于,从多个数据源,获取目标商品关联的多媒体数据,包括:
从商品信息库中,获取所述目标商品的主图片、商品详情信息和/或属性信息;
从音视频信息库中,获取所述目标商品相关的第一视频信息和/或第一音频信息;
从互联网侧,获取所述目标商品的多媒体数据以及与所述目标商品同款商品的多媒体数据。
6.根据权利要求1至4中任一项所述的方法,其特征在于,还包括:
基于所述目标商品的属性信息,确定所述多个类目;或者
根据商品文案预配置信息,获取所述多个类目。
7.根据权利要求6所述的方法,其特征在于,基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目,包括:
获取分类模型;
将所述多个类目及所述多个文本信息输入所述分类模型,执行所述分类模型,得到所述多个文本信息对应的类目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211460790.2/1.html,转载请声明来源钻瓜专利网。





