[发明专利]文件访问方法、装置、设备及存储介质在审

申请号：	202110561924.9	申请日：	2021-05-24
公开（公告）号：	CN113032335A	公开（公告）日：	2021-06-25
发明（设计）人：	顾星	申请（专利权）人：	北京世纪好未来教育科技有限公司
主分类号：	G06F16/13	分类号：	G06F16/13;G06F16/172;G06F16/182;G06K9/62;G06F3/06;G06F9/50
代理公司：	北京市铸成律师事务所 11313	代理人：	邓海鸿;阎敏
地址：	100080 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文件访问方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提出一种文件访问方法、装置、电子设备及存储介质。具体实现方案为：响应接收到应用程序的文件访问请求，调用程序接口获取文件访问请求对应的指定文件；向服务器发送请求信息；请求信息中包括指定文件的元数据信息，元数据信息包括指定文件在服务器中的存储位置信息；接收来自服务器的指定文件的数据；向应用程序返回指定文件的数据。本申请实施例可在人工智能模型训练的过程中提升小文件的读取性能，从而提高小文件的访问效率，进而提升整个存储系统的使用效率，并加快人工智能模型的训练速度。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种文件访问方法、装置、设备及存储介质。

背景技术

随着人工智能技术的发展，AI（Artificial Intelligence，人工智能）模型训练所需要的文件数也在急剧增长。在进行AI模型训练的数据集中，小文件占有相当大的比重。但是，对小文件的数据进行访问时，通常存在随机性强、IO粒度小、磁盘效率低下的问题。在AI模型训练的过程中，由于对小文件的读取速度慢，从而导致海量小文件的访问效率低、访问时间长，进而降低整个存储系统的使用效率和AI模型的训练速度。

发明内容

本申请实施例提供一种文件访问方法、装置、电子设备及存储介质，以解决相关技术存在的问题，技术方案如下：

第一方面，本申请实施例提供了一种文件访问方法，包括：

响应接收到应用程序的文件访问请求，调用程序接口获取文件访问请求对应的指定文件；

向服务器发送请求信息；请求信息中包括指定文件的元数据信息，元数据信息包括指定文件在服务器中的存储位置信息；

接收来自服务器的指定文件的数据；

向应用程序返回指定文件的数据。

在一种实施方式中，文件访问请求中包括执行任务；响应接收到应用程序的文件访问请求，调用程序接口获取文件访问请求对应的指定文件，包括：

从文件访问请求中获取执行任务；

调用程序接口，获取执行任务对应的指定文件，将执行任务对应的指定文件作为文件访问请求对应的指定文件；其中，执行任务对应的指定文件是预先通过程序接口设置的。

在一种实施方式中，上述方法还包括：

向服务器发送元数据信息获取请求；元数据信息获取请求用于获取应用程序挂载的数据集中所有文件的元数据信息；